平顶山互联网行业的皇冠!

平顶山天虹科技是专业从事平顶山网站建设 网站制作 网站推广的超级网络公司,为您提供专业的网络营销解决方案!

CEO手机: 15993534153 QQ:29429666  点击QQ号直接交流或留言

平顶山五星级网络营销服务商!                                                                                                                                                          留言反馈 | 进入平面印刷

平顶山虚拟主机 空间服务

 

平顶山天虹科技有限公司代理中国万网及58同城网,金牌品质,专业服务!
 
SEO效果评价:spider referer 和 keywords  
 

 

SEO效果评价:spider referer 和 keywords

SEO: search engine optimization搜索引擎优化:为了提高来自搜索引擎的流量,SEO已经成为很多商业网站的必修课。但是如何评价网站的SEO效果呢,设计了以下脚本,可以获得以下方面的参考数据:
1 那些网页被搜索引擎的Spider收录: 来自搜索引擎的spider统计;
2 那些网页被搜索搜索到那些网页并被点击: 来自搜索引擎的referer统计;
3 被搜索引擎搜索到的时候使用的那些关键词: 来自搜索引擎的keywords统计;

脚本如下:


--------------------------------------------------------------------------------

架设网站的apache日志使用cronolog进行轮循或者能够获得的时间做为有规律文件名:
/home/apache/logs/access_log.20040415
/home/apache/logs/access_log.20040416
/home/apache/logs/access_log.20040417
/home/apache/logs/access_log.20040418

#!/bin/sh
#$Id: spider_stats.sh,v 1.9 2004/05/15 16:52:44 chedong Exp $
YESTERDAY=`date -d yesterday +%Y%m%d`
# for FreeBSD: YESTERDAY=`date -v-1d +%Y%m%d`

THISMONTH=`date -d yesterday +%m%Y`

LOG_FILE=’/home/apache/logs/access_log’

grep -i Googlebot $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort | uniq -c | sort -rn > spider/$YESTERDAY.googlebot.txt
grep -i baiduspider $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort | uniq -c | sort -rn>spider/$YESTERDAY.baiduspider.txt
grep -i msnbot $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort | uniq -c | sort -rn>spider/$YESTERDAY.msnbot.txt
grep -i slurp $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort | uniq -c | sort -rn>spider/$YESTERDAY.inktomi.txt
grep -i openbot $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort |uniq -c | sort -rn>spider/$YESTERDAY.openbot.txt

# for search entry stats
grep -i www.google.com/search $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort | uniq -c | sort -rn > search/$YESTERDAY.google.txt
grep -i www.baidu.com/baidu $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort | uniq -c | sort -rn > search/$YESTERDAY.baidu.txt
grep -i 3721.com $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort | uniq -c | sort -rn > search/$YESTERDAY.3721.txt
grep -i search.sohu.com $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort | uniq -c | sort -rn > search/$YESTERDAY.sohu.txt
grep -i search.sina.com.cn $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort |uniq -c | sort -rn > search/$YESTERDAY.sina.txt
grep -i search.yahoo.com $LOG_FILE.$YESTERDAY|awk ’{print $7}’ |sort |uniq -c | sort -rn > search/$YESTERDAY.yahoo.txt

# for search keywords stats
grep www.baidu.com/baidu $LOG_FILE.$YESTERDAY | awk ’{print $11}’ |  perl -pe ’s/\\x(\w+)/%\1/gi’ |perl -p -e ’s/%(..)/pack("c", hex($1))/eg’ | perl -pe ’s/(.*)?(word=(.*?))[&"].*/$3/gi’ |sort|uniq -c|sort -rn > keywords/$YESTERDAY.baidu.txt
grep www.google.com/search $LOG_FILE.$YESTERDAY | awk ’{print $11}’ |  perl -pe ’s/\\x(\w+)/%\1/gi’ |perl -p -e ’s/%(..)/pack("c", hex($1))/eg’|perl -pe ’s/(.*)?(q=(.*?))[&"].*/$3/gi’ |sort|uniq -c|sort -rn > keywords/$YESTERDAY.google.txt
grep 3721.com $LOG_FILE.$YESTERDAY | awk ’{print $11}’| perl -pe ’s/\\x(\w+)/%\1/gi’ |perl -p -e ’s/%(..)/pack("c", hex($1))/eg’|perl -pe ’s/(.*)?((p|name)=(.*?))[&"].*/$3/gi’ |sort|uniq -c|sort -rn > keywords/$YESTERDAY.3721.txt
grep search.sohu.com $LOG_FILE.$YESTERDAY | awk ’{print $11}’| perl -pe ’s/\\x(\w+)/%\1/gi’ |perl -p -e ’s/%(..)/pack("c", hex($1))/eg’|perl -pe ’s/(.*)?((key_word|word)=(.*?))[&"].*/$3/gi’ |sort|uniq -c|sort -rn > keywords/$YESTERDAY.sohu.txt
grep search.sina.com.cn $LOG_FILE.$YESTERDAY | awk ’{print $11}’| perl -pe ’s/\\x(\w+)/%\1/gi’ |perl -p -e ’s/%(..)/pack("c", hex($1))/eg’|perl -pe ’s/(.*)?((_searchkey|word)=(.*?))[&"].*/$3/gi’ |sort|uniq -c|sort -rn > keywords/$YESTERDAY.sina.txt
grep search.yahoo.com $LOG_FILE.$YESTERDAY | awk ’{print $11}’| perl -pe ’s/\\x(\w+)/%\1/gi’ |perl -p -e ’s/%(..)/pack("c", hex($1))/eg’|perl -pe ’s/(.*)?(p=(.*?))[&"].*/$3/gi’ |sort|uniq -c|sort -rn > keywords/$YESTERDAY.yahoo.txt


perl -pe ’s/\\x(\w+)/%\1/gi’ : 用于转换: \xe4\x23 这样的转码

perl -p -e ’s/%(..)/pack("c", hex($1))/eg’ : 进行UrlDecode

sort|uniq -c|sort -rn : 用于排序,汇聚计数并按照次数排序输出

 上一条:Google悄悄跟踪用户点击:有可能根据搜索结果点击率改善排名       下一条:搜索引擎-百度的搜索排名原则

SEO优化要记住以下原则:
  1、SEO只是网站推广方法中的一种。
  2、网站推广只是网络营销工作的一部分。
  3、网络营销只是网站运营工作的一部分。
  4、网站运营的目的是为了网站盈利,而不是搞形式。
平顶山天虹科技网络公司专业:  网站优化网站推广

24小时服务热线:15237500186

  平顶山天虹科技有限公司专业网站建设

Copyright © 2017 www.Pdsit.com Inc. All Rights Reserved. 平顶山网站建设联盟 版权所有
[电话]15993534153 [地址] 平顶山市新华路与矿工路交汇处天意花园8层
业务咨询、合作洽谈、求职招聘[客服QQ] 29429666点击这里给天虹科技网站建设发消息! [信箱] chinalhg@qq.com
如何找到本站?在百度搜索关键词:平顶山网站建设平顶山网站推广平顶山网站设计平顶山网站优化平顶山网络公司平顶山网站联盟。百度快照均排名第一!
平顶山市天虹科技是平顶山优秀专业的建站第一品牌!
国家信息产业部备案:豫ICP备11012270号-1