首页 存档 技术 查看内容

R 和 Python 中的文本挖掘:8 个入门小贴士

2018-3-30 13:00 |来自: 互联网 325 0

摘要: 点击上方“Datartisan数据工匠”可订阅哦!投稿邮箱:[email protected]对文本保持好奇 在数据科学世界中,凡事的第一步都是“感到好奇”,文本挖掘也不例外。 就像 StackOverflow 的数据科学家 David Robinson ...

点击上方“Datartisan数据工匠”可订阅哦!

投稿邮箱:[email protected]

对文本保持好奇


在数据科学世界中,凡事的第一步都是“感到好奇”,文本挖掘也不例外。


就像 StackOverflow 的数据科学家 David Robinson 在他的博客中说的那样,“当我看到一个假设 […] 我就迫不及待地想要用数据验证它”。你也应该像他那样对文本保持好奇心。


David Robinson 看到的假设是:

即使你并不打算真的去验证它,你也应该对自己看到的词云图感到好奇,并且有想要自己动手复现一遍的想法。


如果你还未能感受到文本挖掘的魅力,那就来看看这些最近在媒体上广受关注的文本挖掘应用案例吧,比如 South Park dialogue, film dialogue 等等,你会从中得到启发。


掌握你所需要的知识和技能


当你拥有了好奇心,是时候去学习关于文本挖掘的知识和技能了。你可以通过完成一些教学课程轻松地做到这一步。


在这些教程中你需要格外关注的是数据科学工作流中的基本步骤,比如数据预备和预处理,数据探索,数据分析等等。


推荐阅读:

  • Ted Kwartler: Text Mining in R: Are Pokémon GO Mentions Really Driving Up Stock Prices?

  • Ted Kwartler: Text Mining: Bag of Words

  • Neal Caren: An introduction to text analysis with Python

  • Kaggle: Part 1: For Beginners - Bag of Words

  • DataCamp: Learn Data Science - Resources for Python

声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部