跳过导航
跳过mega-menu

《数据科学家的一天

互联网会让你相信,数据科学是21世纪最性感的工作,同时也是最有可能过时的角色. 困惑? 是的,我也是. 

这一点也不困扰我. 作为数据科学家,我们喜欢概率,我们对任何事情都不确定. 这意味着我们不太擅长解释我们实际在做什么. 我能做的就是告诉你在KrakenFlex做一名数据科学家是什么感觉


最棒的部分

作为KrakenFlex的数据科学家,最好的部分就是我们要解决的问题. 它们是非常复杂的问题,以前没有人解决过,它们直接有助于防止气候变化. 

我所在的团队目前正在开发控制电动汽车夜间充电的软件和算法,以使用最环保、最便宜的电力.  (http://octopus.energy/intelligent-octopus/ 这涉及到预测(有多少辆汽车需要充电,它们需要多少能源)?)和优化(我们应该何时收费?). 两者都是极具挑战性的数据科学问题,也是能源行业面临的新问题. 交通运输电气化是一种趋势,它带来了与我们以前所经历的完全不同的电力需求. 最令人兴奋的是,这种需求是灵活的,在KrakenFlex,我们为灵活性而活! 

什么是灵活性? 想想下午6点下班回家后给电动汽车充电的人. 下午6点,当大家下班回家做饭时,很多人都在用电,电网承受着压力. 这个人的车很可能不需要马上充电. 相反,我们可以等到半夜需求低得多的时候, 当所有人都睡着了. 这就是我所说的灵活性. 在一天的不同时间点打开和关闭事物的能力. 这一点变得越来越重要的原因是,我们很快就会有多少电动汽车上路, 再加上热能的电气化,我们将不再使用传统的燃气锅炉.

通过将需求从高峰(下午4点至7点)移走,我们可以帮助减少化石燃料发电厂需要通电以满足需求的情况. 几十万辆汽车在家里充电, 同时将需要相当于一个大型电站的功率.  

我们在KrakenFlex的其他数据科学家也在研究酷, 复杂问题-包括, how to optimise grid scale batteries; researching how a local energy market might work; or building new functionality into our optimisation tooling. 


奇怪的部分

团队名称. 数据科学家分布在KrakenFlex的各个部门,组成跨职能团队. 我是"时髦长臂猿"的一员,,是3名软件工程师的家, 2数据科学家, 我们的产品大师. 我们还有一个数据科学协会,所有的数据科学家聚集在一起分享知识或互相帮助. 以这种方式工作提供了很多很好的学习机会. KrakenFlex鼓励数据科学家像开发人员一样编码,并帮助他们实现这一目标, 通过大量的结对编程机会(组队并与其他人一起编码). 数据科学团队也不甘示弱?  有自己的标志,我还没看懂,但里面有一只独角兽. 我们不能被指责太把自己当回事! 

当我们在能源灵活性领域工作时, 我们也可以在家和办公室之间灵活地工作. 


技术部分

如果我要尝试分解KrakenFlex数据科学家的典型工作流程,它看起来像这样: 


1 .发现

这是我们弄清我们试图解决的问题的细节的地方. 我们使用Miro, 这就像一个在线白板, 我们问了很多问题来梳理我们真正想要做的事情. 我们倾向于作为一个团队来做这件事,这使得它具有互动性和概念上的趣味性. 理解我们为什么要解决这个问题也很重要(以防它根本不需要解决)。. 


步骤2 -概念验证

数据科学家的下一阶段可能包括使用Jupyter Notebook来测试发现中提出的想法,并开始构建概念证明. 在这里,我们可以真正开始深入研究方法或算法如何工作的细节,以及结果是否可能满足我们需要的要求. 这个阶段通常是非常反复的,我们会定期将结果提供给产品团队或客户以获得反馈. 我们还可以利用自公司成立以来我们一直在构建的优化框架的组件. 这里没有规则,我们只是在寻找解决问题的最佳算法或方法. 


3 .构建

第三个阶段可能涉及从概念验证工作到主要代码库构建最佳版本. 这是我们将再次开始与软件工程师密切合作以构建交互的地方, 数据馈送和测试将可靠地捕获我们实现中的任何错误. 这项工作将不再在笔记本中进行,但仍将基于Python.


步骤4 -监控

一旦产品投入生产,我们就不能放下工具放松了. 我们需要考虑我们的解决方案的性能如何(我们节省了多少碳和金钱),并长期监控这一点. 除了软件开发人员,我们还研究如何最好地存储和查询我们的数据,以便其他同事可以使用它. 比如我们的车辆充电优化, 客户可能会在一夜之间联系他们的汽车充电问题. 重要的是,客户支持团队可以轻松访问任何数据,以帮助他们向客户解释出了什么问题,并提供良好的客户体验. 


有趣的部分

时髦的吉本斯对在线棋盘游戏情有可本(没有什么比用触控板玩猜字游戏更有趣的了)。. 我们也会定期完成回顾,作为一个团队,我们会庆祝进展顺利,并根据上一次冲刺提出我们可以改进的方法. 每个项目在技术上都是不同的,我们也在不断调整我们的工作方式. 或者像上周那样, 我们参加社交活动,看看谁是飞镖高手(不点名).


我有什么建议吗? 

如果你想进入数据科学领域,我的建议总是很简单. 找到一个你感兴趣的问题,然后开始尝试用数据来解决它. 从python开始,从Jupyter Notebook开始. 我认为解决自己的问题更有动力,也更现实地面对现实中的挑战. 例如,我喜欢能量和运动,所以我会考虑这样的事情:

  • 使用你自己的智能电表数据来预测你的用电量.

  • 使用智能手表上的运动数据来分析你的心率和训练表现.

你可以做很多不同的事情. 或者,你可以找到更结构化的问题,这些问题已经在正式课程中列出了. 这些都很棒, 但请记住,数据科学家的部分工作是理解需要解决的问题. 我鼓励你不要被你需要获得的如山的知识所吓倒. 你会惊讶于你能如此迅速地开始贡献. 

你可能已经注意到,我没有提到机器学习、统计学或人工智能, 和确定, 这些都是与Krakenflex数据科学家的世界相关的术语, 但是,在我们的生活中,还有比这些流行语可能给我们带来的更多的东西. 不管你是否相信互联网对数据科学的看法, 我希望分享KrakenFlex数据科学家一天的生活对大家有所帮助. 有一波数据科学问题需要解决,以使世界达到净零,如果这听起来很令人兴奋, 你不会失望的. 

十大正规博彩网站评级

在这里注册