请放鼠标一条生路
50 年后的今天,有人一边心里 MMP 一边用鼠标一条一条的复制粘贴 Listing 和 Review 做「产品调研」。
(黑人问号.JPG)
不用鼠标,我特么还能用什么?!
如何抓取亚马逊的商品评价(Review)?
OK,OK,本来这次想继续走我所的硬核路线,「长篇大论」的教大家如何用火车头 / 八爪鱼 / Web Scraper 等采集器软件爬取亚马逊 Listing 和 Review。直到我发现了这个插件 Instant Data Scraper,当时我差点被感动哭了。之前费力去研究网页结构,烧脑去编写采集规则是为了什么?!
去你的火车头!
去你的八爪鱼!
去你的 Web Scraper!
有 Instant Data Scraper 就好了!
也不用怕网页结构改变,采集规则失效的问题了!
小白也可以轻松使用上亚马逊评价采集爬虫技术!
什么是 Instant Data Scraper?
据称此插件使用 AI (人工智能)技术,可以判断页面中最相关的内容进行抓取,并不需要你懂得晦涩的编程技术。Amazon、 eBay、Best Buy、Walmart、Etsy、Home Depot、Craigslist、Yelp 等网站都能支持。
经我初步使用,发现它不大会发生「人工智障」的问题,起码爬取亚马逊商品评论(Customer Reviews) 是非常方便的,大爱!
如何使用 Instant Data Scraper?
在 Chrome 网上应用店搜索并安装插件「Instant Data Scraper」。如无法访问 Chrome 网上应用店,可以离线安装插件。安装方法请自行搜索「如何离线安装 Chrome 插件?」。
关注「瓦特研究所」公众号,在后台回复「009」,获取「Instant Data Scraper」插件安装文件。
插件使用起来非常非常非常简单,以采集亚马逊 Review 为例:
- 打开产品 Reviews 页的第一页,网址格式如:https://www.amazon.com/product-reviews/产品的ASIN
- 点击 Instant Data Scraper 插件图标,激活「精灵球」
- 「精灵球」会自动判断可抓取的页面区域,如果区域不对,点击 「Try another table」 按钮可以切换区域
- 点击「Locate “Next” button」 按钮来定位页面中的「Next」按钮或链接
- 点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错
- 等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件
- 打开下载好的 CSV 或 Excel 文件,删掉你不需要的数据列即可
简单吧?7 步搞定亚马逊评价(Reviews)的爬取和采集!另外,Q&A 也是可以爬取的哦。
有了这些 Review 评论信息,我们可以利用关键词云图(词云)和文本情感分析等大数据分析工具,快速对产品的特性和消费者情感做出大致判断,而不需要一条一条的去阅读 Review,比较适合大范围的批量选品。想知道怎么操作吗?留言给我,人多的话,阿狸我再考虑是否开篇详述。
当然了,整个流程完全可以实现工具自动化,让机器 24 小时不间断进行自我学习和智能选品。(不是异想天开)
未来,我们会不会被 AI 取代?(不开玩笑)
原创文章,作者:阿狸,如若转载,请注明出处:https://www.watelab.com/how-to-scrape-amazon-reviews/
评论列表(2条)
手工复制粘贴了N轮…马上测试,节省拯救地球的时间。
@lishowping:测试好了记得来反馈哦