操纵光年日记阐发东西停止的一次网站日记阐发

2012年4月27日 | 标签:

东西: 外面有东西用法的先容

这里首要是讲下咱们现实任务中怎样操纵这个东西 清算数据

东西是死的 取得的数据也是凉飕飕的 可是阐发的人是活的 须要讲这些数据连系网站的详细环境阐发 而后取得一些论断 和致使这些题目的缘由 最初是处理方式

起首须要找办理办事器的人 或ftp上(有些假造主机是供给最新3天的日记下载)下载这个log文件

log文件外面记实了网站上每一个文件被援用的状况 被谁 甚么时辰

普通办事器上日子文件保管的几个月乃至几年的都有 若是拜候量比拟大 这些日记文件也变得很是的痴肥 以是光年

东西在速率上仍是很值得歌颂的 很快就会取得上面的数据

列出了一切搜刮引擎对网站资本的抓守信息 若是你看到外面百度不来你网站 那末你很能够便是被k了 或降权了 也很难取得百度的权重

定单

把这些数据都清算到excel中便利做图阐发 和做给老板看

好的员工不应当是单打独斗而是要让你的下属晓得你的思虑的进程和采用的战略 而不是本身发明 本身处理

这是做营销的人的应当懂的 怎样去营销本身

从这个图便能够便利的晓得 这么多搜刮引擎 只要搜狗是抓的最多的可是连系流量和市场占最近看 抓这么多 带来的流量这么少

是否是能够斟酌对他做些限定 或看下为甚么他抓这么多页面 其余抓这么少

 

这里交接下网站背景 是处置b2b行业的

/campaign/是做sem的landing page的目次 今朝做百度和谷歌的sem

/colleage/是做行业内的最新的消息静态的页面 每一个礼拜城市更新内容

/search/ 是这个b2b行业内客户的信息 外面有上万客户的信息 这也是搜刮引擎优化优化的重点 由于内容多 可是单个页面信息量比拟少 可贵取得权重

/showcase/是这个公司的案例阐发 比拟信息

/solution/是这个公司的首要产物信息

而后对4个搜刮引擎每一个引擎中抓取的目次的页面停止阐发 取得差别的action

百度的大局部时候都在抓取/Campaign/这目次 可是这个目次是做sem的目次 对搜刮引擎优化意思不大是否是能够斟酌屏障百度蜘蛛,或判定应当百度抓取网页和抓取sem 的langdingpage操纵的是统一种蜘蛛 以是会反复抓取

谷歌抓取的特色是他会抓取en目次下 也便是英文页面 百度就不怎样喜好英文的 以是抓取占比少

 

 

  1. 2019年3月25日10:05

    进修了,感激博主