人机交互|2022年十大最实用的数据科学技术( 二 )


讲故事是指“如何”跟别人表达你的见解和模型 。 从概念上讲 , 如果我们用一本图画书做比喻 , 见解/模型就好比是书里的一张张图片 , 而“讲故事”则是串联起所有这些图片的叙述 。
在科技界 , 讲故事和沟通是被严重低估的技能 。 从我的职业生涯来看 , 这种技能水平的高低 , 也代表着初级员工与资深员工和管理者之间的差距 。
5. 回归/分类你要能够构建回归和分类模型 , 即预测模型 , 也许这些并不是你一直在做的事情 , 但如果你是一个数据科学家 , 雇主会希望你也能够承担起来 。
【人机交互|2022年十大最实用的数据科学技术】即使这些事情你并不会经常做 , 你也必须精通 , 因为需要建立高效能的模型 。 在我迄今为止的职业生涯中 , 我只做过两个机器学习模型的产品化 , 但它们对业务的影响至关重要 , 是非常关键的任务模型 。
因此你应该对数据预处理、增强算法、超参数调优和模型评估指标有充分的了解 。
6. 解释模型通常人们会建立两种类型的模型 , 一种是预测模型 , 即根据一些输入的变量来猜测出一个结果;另一种是解释模型 , 它不是用来预测的 , 而是用来更好地理解输入变量和输出变量之间的关系 。
解释模型通常使用回归模型创建 , 因为它们可以为理解变量之间的关系提供很多有用的统计数据 。
解释模型的价值目前是被严重低估了 , 但是它真的非常有用 , 如果你想探索决策科学领域 , 解释模型是必不可少的 。
7. A/B测试(实验)A/B测试是一种实验形式:将两个不同的群体进行比较 , 看哪一个基于给定的指标能够有更好的表现 。
A/B测试可以说是企业界最实用的统计方法 , 应用范围也最广泛 。 A/B测试允许你将100个或1000个细微的改进不断进行复合测试 , 随着时间的推移 , 持续的积累会产生重大的变化和改进 。
如果你对数据科学统计感兴趣 , A/B测试则是必须要了解和学习的 。
8. 聚类在我个人的职业生涯中还没有使用过聚类 , 但它是数据科学的一个核心领域 , 即使不用 , 至少应该熟悉 。
聚类在很多方面都很有用 。 通过它你可以找到不同的客户群 , 你可以用聚类来标记未标记的数据 , 你甚至可以用聚类来寻找模型的切入点 。
9. 推荐虽然我自己的职业生涯中还没有建立过推荐系统 , 但它确实是数据科学中最实用的应用之一 。 推荐系统之所以强大 , 是因为它们有能力带来营收和利润 。 例如 , Amazon声称他们的推荐系统在2019年将公司销售额提高了29% 。
因此 , 如果你的公司用户必须要面临选择 , 而且他们有很多选择 , 那么推荐系统可能对你们的业务非常有用 , 值得大力探索 。
10. NLPNLP(即自然语言处理)是人工智能的一个分支 , 专注于文本和语音分析 。 与机器学习不同 , 我认为NLP还远未成熟 , 这也是它的有趣之处 。
NLP有很多用例 。

  • 它可以用于情感分析 , 以了解人们对一个企业或一个企业的产品的感受 。
  • 它可以用来监测一个公司的社交媒体 , 把正面和负面的评论区分开 。
  • NLP还是构建聊天机器人和虚拟客服的核心技术 。
  • NLP被用于文本提取(筛选文件) 。
总的来说 , NLP在数据科学领域是一个非常有趣和有用的细分领域 。
我希望以上这10条有助于指导你的学习 , 能为你以后的工作提供一些方向 。 学海无涯 , 选择几个你听起来最感兴趣的技能 , 现在开始吧 。
译者:张茉茉

相关经验推荐