- Jupyter数据科学实战
- (印)普拉泰克·古普塔
- 365字
- 2025-02-23 03:15:43
1.2 数据科学的定义
众所周知,数据覆盖现代经济的各个领域。麦肯锡咨询公司在2013年的一份报告中预测大数据在美国医疗中的应用有望使医疗费用每年减少3000亿~4500亿美元,所节省的资金相当于2011年美国医疗相关支出(2.6万亿美元)基线水平的12%~17%。但是,质量较差的数据或者非结构化数据预计将让美国每年损失高达3.1万亿美元[1]。
以数据驱动决策的理念越来越受欢迎。从非结构化数据中获取信息比较复杂,并且也不能简单地通过商业智能分析工具完成,因此数据科学应运而生。
数据科学是一个专注于从原始数据中提取知识和见解的跨学科领域,主要应用到数学、统计学、计算机科学和编程语言等学科,它们均为数据科学家的必备技能。找到问题的解决方案是数据科学家的职责所在,他们对此充满好奇与热情,拥有较强的自我驱动力。图1-4展示了一名现代数据科学家应具备的技能组合。

图1-4 现代数据科学家必备技能