作为数据分析的搬砖工,平时被非同行问到最经常的问题就是 “你们的模型准确吗” “做模型有用吗” “企业真的需要数据分析吗”。
今天看到了一名华裔Youyang Gu所创立的Covid 19预测器预测美国因新冠造成的死亡人数等等。这个网站是这名大神一个星期就做出来的,比起其他专业机构各种fancy的模型,Gu用到的是相对来说比较简单的模型,他的模型唯一的input就是死亡人数。
虽然这个模型看似简单,但是预测结果相当准确。比其他专业机构的预测准确率高非常多,非常接近真实结果。比如他预测5.9日美国有8w人因新冠死亡,而当天实际死亡人数为79926。作为模型预测来说可以说误差很小了。被专业机构评价为“唯一看起来合理的模型”。
所以真应了那句“有时候简单的模型就是最好的”。
当然他的这个模型同样指出来美国在2021年底不太可能达到“群体免疫”(或者说“恢复常态”)。
回到第一段的问题,其实任何模型都有自己的误差,但是建立模型还是可以帮助预测分析将来的趋势,对将来的process进行指导。这个是我当初入这一行最大的原因,觉得利用数据来进行分析真的是很迷人的一件事。
最新评论 7
:您好呀 现在internship太难找啦 请问一下data analyst unpaid internship 容易找到嘛
:unpaid我感觉应该不难找?你可以看看学校里有没有什么资源,我刚来美国给学校的project做过一学期unpaid工作,不过后来找到实习就没做下去了
回复 @快乐加倍:我是ds
:没错大道至简,我一直笃信这一点,如果你的东西还不够简单,那一定是因为离本质还不够近。
:说的超级有道理!!!