早上七点四十,我挤上了红线地铁。车厢里一半是学生,一半是和我们一样背着双肩包的药企打工人。出站时看了眼手机,三个Slack消息,一个是从西海岸发来的,另一个是波士顿本部的统计经理问我今天的会议时间。
.
到公司先冲了杯咖啡。我们这层实验室和办公区混在一起,空气中常年飘着培养基的味道和咖啡香。坐下打开Jupyter Notebook,昨天跑的模型出了结果,AUC勉强过了0.7,但临床那头肯定不满意。九点半的站会是雷打不动的,统计组、临床组、数据管理轮番过进度。我负责的那个三期试验的biomarker分析卡在数据质量问题上,EDC系统导出的数据又有缺失模式,得和DM扯皮。
.
十一点和临床科学家开会。对方是MD,对机器学习不太感冒,但FDA最近在推real-world evidence,公司不得不跟上。我解释为什么XGBoost比逻辑回归更适合这个biomarker筛选项目,他说那你给我一个能解释的P值。我笑了笑说行。
中午带饭去查尔斯河边吃的。公司冰箱里有免费酸奶和面包,顺手拿一个。边吃边刷LinkedIn,看到前同事跳去了flag,想了想波士顿的生活成本,觉得现在这样也还行。
.
下午两点给VP做项目update,十分钟讲完结果,然后被问了二十分钟“这个模型到底能不能帮我们省临床试验的money”。我指着验证曲线说假阳性率降了15%,他点头,让我写个memo发给监管事务组参考。
四点以后终于安静下来。开始写Python脚本,把新来的蛋白质组学数据整合进去。隔壁组的生信小哥过来问能不能共用我写的feature engineering pipeline,我扔了个git link给他。
.
六点下班,走之前顺手把明天的task在Jira上拖了拖。出公司门天还亮着,波士顿夏天就这点好。手机弹出消息,波士顿本地的drug discovery meetup下周有活动,犹豫了三秒,点了interested。
这就是我在中型药企DS的日常——不是在写代码,就是在解释为什么代码能帮公司少亏点money。
还有DS / DA 的openings(junior). 也有intern .厚/苔/d/M