题图:Emily Cheng 手绘, Airbnb 程序媛,我的邻座 我欠你一个道歉:昨天这篇发了一遍,原本是为了发文敬贺 “极客邦科技” 的「技术社群大会」圆满召开,也感谢“技术社群联盟”让我加盟,成为他们的一分子。且本人其实又和 “中生代社群” 有着很亲密的关系。 结果可能看朋友们都 “约会” 在大会现场,可能去不了心里有遗憾,硬是把标题的 “data scientist” 错写成 “date scientist”,bug 有点大,只好删了。结果后台收到几百条留言各种互动,早知道就不删了,留下这个美丽的错误好了。 硅谷的大部分公司,都有很多的 Data Scientist,简称 DS,不知道国内是不是叫数据科学家。 前几天 InfoQ 的网站上发布了一篇文章《Airbnb支付平台如何进行异常检测》(文末 “阅读原文” 进入),翻译的是 Airbnb 公司博客上的一篇英文原文。 这篇文章讲的是 Airbnb 的一个异常探测系统:
注:InfoQ 作为 IT 媒体界的翘首,在规范翻译英文博客的流程上起了一个很好的表率。首先就翻译的准确性来说,InfoQ 网站上的翻译总的来说质量是很高的,也有专人校对。此外,我知道他们翻译的文章是联系授权的,就说这一篇,也是得到了 Aribnb 的 eng 部门和 PR 部门首肯的。在此对 InfoQ 对知识产权的尊重表示一下个人小小的敬意。 这个异常检测系统我们现在仍然是在使用的,不过略有进一步的改进和完善。英文原文是我们组的一位 Data Scientist 陆竞骁 写的。发布之后,也有几个朋友私下问了一些细节问题,比如:“这样的系统是怎么从无到有做出来的?” “需要什么样的人来做?” 等等。所以今天就大概聊聊公司对 Data Scientist 的技能要求以及平时工作的一些大概内容吧。 顺便提一句,Twitter 其实也有一个类似的异常检测系统的基于 R 语言的开源包 :https://blog.twitter.com/2014/breakout-detection-in-the-wild。和我们的主要区别在于对于 seasonality 的处理。Airbnb 使用 FFT 模型来模拟seasonality 的方式可能使用起来更加灵活一些。有兴趣的可以下载 Twitter 的开源包https://github.com/twitter/BreakoutDetection ,然后根据自己的需求做类似的系统。我们的系统目前还没有开源。 Data Scientist 都做什么? 在一般的互联网公司,DS 的工作可能包括(却不止于)下面四类:
Data Scientist 都有什么样的学术背景? 大都 DS 都是来自于数学和统计专业。然而也有很多来自物理、机械工程、金融等专业。相对而言,DS 比码工的平均学历要高,也就是硕士博士的比例更大一些。 知乎日报上《如何成为一名数据科学家?》一文中提到:
怎样算一个优秀的 Data Scientist? 其实除了金融等领域对 DS 的技术背景有着上面的严格的要求,很多互联网公司如 Square、Airbnb、Facebook 等对于技术背景达到一定的水准后,更看重的其实是另外一些软技能,如:
这也是为什么很多硅谷的公司在招 DS 的时候,更愿意招有工作经验的 DS,很多中小公司甚至干脆不招毕业生。而因为各种数据生成的 dashboard, 更是公司高层做决定的一些主要依据。 Data Scientist 在硅谷的薪资是怎样的? 这个问题我的数据不够,不好以偏概全的来误导。不过倒是让我想起来另外一件事。 大家经常看到 LinkedIn、GlassDoor 等网站对各个职业的平均水平进行统计。我和我的一些朋友觉得,这些数据其实是很 bias 的,而且基本可以说是偏低的。为什么这么说呢?我猜有两个原因。第一,刚入职场的人更喜欢参与这样的统计调查。而比较 Senior 的人,其实几乎没有人或者很少有人去参与这样的调查。第二,很多高工资的公司参与这样的统计调查的人要相对较少。我为什么这么猜?只是从我认识的人提起这样的一些统计数据都觉得比实际情况偏低推测的。不用跟我争辩,我只是说出我的观点,信不信由你。 为什么 Data Scientist 很重要? 没啥可说的了:可信的数据、靠谱的解读,是做出正确判断的重要基础。 所以对于很多公司而言,招到优秀的 Data Scientest,其实和招到优秀的软件工程师一样重要。 而一个公司在多大程度上由数据驱动,看看他们 Data Scientist 与工程师的比例,也就大概有个谱了。 广告也八卦:因为这篇谈到数据科学家和数据分析,不禁想起来 IT 自媒体里面一位喜欢靠数据说话的公众号作者。“caoz 的梦呓” 这个公众号可能 “嘀嗒嘀嗒” 很多的读者已经订阅了。号主人称 “曹神”,没错,就是前几天推荐过我的公众号的那位。曹神推荐了我的公众号,却偏偏要对我的写作技巧、公众号取名等各种吐槽。有我的朋友替我抱不平,说 “曹神又黑你了。” 其实他也就是喜欢装的比较高冷而已,私底下人其实可好了。否则就不会一边挑我的刺,一边无偿帮我打广告啦。 曹神到底是谁?这里卖个关子。我开始也是不认识他的,后来因为写公众号,才断断续续有了些许交集,从一些朋友那里听到一些传说,才知道不小心认识了个牛人。曹神在互联网圈子里混的挺有些年头了。对互联网数据掌握之全,和互联网趋势的敏感性都是有过人之处的。尤其是2006-2009这段时间。引用大辉哥的原话 “他的内容,内行看门道,外行看热闹。” 他的公众号更新的比较勤快,所以总会三不五时有那么一篇两篇让你有所收获吧。 写公众号认识了一些很有趣的朋友。喜欢彼此对写作技巧或观点偶尔吐个小槽。曹神说我的写作技巧不咋地,然而另外两三个大号作者私下在朋友圈或私信里也有对我说,说曹神比较罗嗦(哈哈)。所以这么看来,到底喜不喜欢他的文章,你还是自己去看看吧。反正是我最喜欢的几个号之一了。(我的这段广告写的也是有够嗦的了。本来打算自己的地盘,反吐槽回去,然而写成这样,只能说我还是不够彪悍了,呵呵……) 下面是 “嘀嗒嘀嗒” 的二维码:硅谷程序媛视角为您讲述技术、八卦硅谷。偶尔讲讲故事。 本文转载自:微信公众账号 - 嘀嗒嘀嗒,版权归原作者所有! |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|