细节往往出现在不起眼的地方。-Max狗

接上篇《冷门项目之百度竞价赚钱之旅-信息源上》

3.垂直论坛的深度挖掘

搜索论坛的方式,和在国外搜索行业的方式一样。我在之前的文章也讲过。

百度搜索“兴趣+论坛”,就可以得出非常多的结果。现在比较大的领域,一般都有相应的论坛。

  • TIPS:可以通过观察相应的论坛的活跃度,来确定这个兴趣的领域是否足够大。

比如搜“微电影论坛”。我们可以发现,相应的论坛的活跃度都挺低。这代表对这个兴趣比较感兴趣的用户,不活跃在百度这个平台了。

640.jpg

问:不活跃在百度,意味着这个项目没有价值吗?

答:并非如此。不活跃代表这个项目的价值在别的平台转移。我在后面的《百度全栈SEM大师班》里会提及。

再比如,冷门SEM的热门标的项目“疾病类”的论坛,我们就可以很容易的挖掘到一些细枝末节的细节。

比如哮喘。

640(1).jpg

我们就可以在帖子中发现病人的问题,以及他们是否需要一些辅助设备。由于疾病类的比较敏感,建议通过特殊的角度进行切入。

当搜寻了这些问题或者项目的时候,记得反向进入百度的竞价后台查询,就可以获得准确的数据。

4.信息源的模块化建设

4-1 以百度贴吧为例的自动化模块化设计

既然要做信息源的收集,那么节约时间就显得非常必要。

首先,我们要确定自己要做的是大概的什么方向。譬如,自己如果之前有做过文玩,或者这方面的兴趣,那么就可以围绕这个方向进行收集。

在这里呢,我们可以做一个表格做一下数据上的规划。

通过之前文章的方法,我们去百度贴吧做第一层的模块化数据筛选。

排除:搜索量极低的,不符合大小原则的。

然后,我们就可以大概做出这样的图表。

3.png

然后,就可以将相关的搜索词(子兴趣),作二次的流量分类。

4.png

分类以后,我们就可以开始做数据的筛查了。但是现在问题来了,如此庞大的子兴趣,我们如何有效的提高效率呢?

答案是采集。

现在的第三方软件已经非常方便,比如:八爪鱼等。八爪鱼目前的整体功能基本上已经做到了“可视化”。简单操作,即可获得详实的数据。

那么,如何定义采集的规则呢?

4-1-1 页面里面有什么?

在知道我么想要什么之前,我们先要理解,网页是什么。网页说一个通俗的比喻,就是一张叠一张的纸。比如,我们打开“核桃”吧,我们在第一张纸看到的内容是以下。

分类、标题,最后回复时间。

5.png

4-2-2 我们想要什么?

根据之前的文章,我们知道,我们要的是:

  • 兴趣的活跃度

  • 兴趣内的需求

  • 兴趣内的产品的价格

4-2-3 我们怎么做?

1.判断我们想要的数据,在不在当前页面

如,我们想要了解的活跃度,就可以通过第一层页面帖子最右侧的最后回帖时间进行部分解决。

6.png

2.我们想要的数据,需要多少种指标?

譬如,我们想要知道的是“核桃”这个子兴趣的活跃度。那么,主吧页面的最后回复帖子的时间是不足以佐证的。

我们需要打开第二层页面,观察更多所需的指标。

如是否需要统计第二层页面的回复数,参与的ID

7.png

如贴中的“阿墨文玩”就是典型的一个ID。

注:“核桃”吧是一个商业化非常严重的贴吧。通俗的说,嗯,大部分的内容是通过某种付费/免费形式,给予部分的人充足的发帖权限的,大家懂就好。

但是其他业务的贴吧,尽量把ID也作为一个指标进行统计。如ID的数量。(多样化)

同理,其他想要的数据我们也可以这样一层层的剥离。这样就可以非常简单的搭建自己的信息源了。