重要的SEO HTML标签
1. Title (标题标签)
<head>
<title>关键词</title>
</head>
2.H1,H2,H3 标签
<H1>最重要的题目</h1>
<h2>第二重要的题目</h2>
<h3>第三重要的题目</h3>
3.bold, strong(粗体标签)
<b>关键词</b>
<strong>关键词</strong>
4.Image (图片)
<img src=”图片.jpg” alt=”关键词” />
5.Hyperlink (超链接)
<a href=”/ 网页.html”>链接内容</a>
6.Hyperlink (No Followed)(排除索引的超链接)
<a href=”/ 网页.html” rel=”nofollow”>链接内容</a>
搜索引擎限制要求
1.网页文件大小
不多于150KB
2.网页内超链接数目
不多于100个超链接(单页)
3.超链接地址上的参数
不多于2个参数
不好示例:
http://www.mysite.com/brands.php?
object=1&type=2&kind=3&node=5&arg=6
友好示例:
http://www.mysite.com/brands.php?nike
4.超链接地址深度
不多于4层链接
不好示例:
http://www.mysite.com/people/places/things/
noun/danny/car
友好示例:
Http://www.mysite.com/people/danny
5.网页标题(title)
一般不超过100个字节
6.关键词(keywords)
一般不超过160个字节
7.网页描述(description)
一般不超过400字节
8.关键字密度
一般在5-7%
针对SEO优化的301友好重定向规则(Apache主机)
需要在服务的根目录上建立一个名称为”.htaccess” 文件。
你需要能够查看服务器上的隐藏文件,还有服务器的mod_rewrite功能必需支持并开启。
1. Redirect 301/旧网页.html http://www.新域名.com/新网页.html
把旧页面.html文件重定向至新域名中名称为新网页.html
2. Options +FollowSymLinks
RewriteEngine on
RewriteCond %{HTTP_HOST} ^mysite.com [NC]
RewriteRule ^(.*)$ http://www.mysite.com/$1 [L,R=301]
把访问者要求访问的http://mysite.com重定向到http://www.mysite.com.
3.Entire site:
Redirect 301 / http://www.newdomain.com/
Redirect permanent /old http://www.newdomain.com/new
把整个旧的网站从旧域名转到一个新的域名中去.
针对SEO优化的网站标题及首页形式
1.标题形式
网站名称| 站内分类名称> 次级分类名称- 网页名称
2.首页地址形式
Http://www.mysite.com
http://mysite.com
http://www.mysite.com/index.html
http://mysite.com/index.html
常见网络爬虫
Google Search Googlebot/2.1 (http://www.google.com/bot.html)
Google Search Googlebot/2.1 (http://www.googlebot.com/bot.html)
Google Image Search Googlebot-Image/1.0
Google Image Search Googlebot-Image/1.0 (http://www.googlebot.com/bot.html)
MSN Search msnbot/x.xx (http://search.msn.com/msnbot.htm)
MSN Search MSNBOT/0.xx (http://search.msn.com/msnbot.htm)
MSN Media Search Robot msnbot-media/1.0 (+http://search.msn.com/msnbot.htm)
Windows Live Product Search msnbot-Products/1.0 (+http://search.msn.com/msnbot.htm)
Microsoft Search for Mobiles MSNBOT_Mobile MSMOBOT Mozilla/2.0 (compatible; MSIE 4.02; Windows CE; Default)
Alexa / The Internet Archive ia_archiver
Alexa / The Internet Archive ia_archiver-web.archive.org
Alexa / The Internet Archive ia_archiver/1.6
Yahoo Blog Search
Yahoo-Blogs/v3.9 (compatible; Mozilla 4.0; MSIE 5.5;http://help.yahoo.com/help/us/ysearch/crawling/crawling-02.html )
Yahoo Multimedia Search Yahoo-MMAudVid/1.0 (mms dash mmaudvidcrawler dash support at yahoo dash inc dot com)
Yahoo Product Search
YahooSeeker/1.0 (compatible; Mozilla 4.0; MSIE 5.5; http://help.yahoo.com/help/us/shop/merchant/)
Yahoo Product Search
YahooSeeker/1.0 (compatible; Mozilla 4.0; MSIE 5.5; http://search.yahoo.com/yahooseeker.html)
Yahoo Product Search
YahooSeeker/1.1 (compatible; Mozilla 4.0; MSIE 5.5; http://help.yahoo.com/help/us/shop/merchant/)
Ask / Teoma Search Mozilla/2.0 (compatible; Ask Jeeves)
Ask / Teoma Search Mozilla/2.0 (compatible; Ask Jeeves/Teoma)
Ask / Teoma Search Mozilla/2.0 (compatible; Ask Jeeves/Teoma; http://about.ask.com/en/docs/about/webmasters.shtml)
针对网络爬虫的META标签
用法:<meta name=”ROBOTNAME” content=”可选参数”>
其中”ROBOTNAME”为爬虫名称,一般为”robot”.它的名称也可以由服务商指定(详细见上页表).
可选参数:
noindex Google, Yahoo, Live, Ask 不搜索本页内容
nofollow Google, Yahoo, Live, Ask 不要跟进搜索本页内的所有链接
noarchive Google, Yahoo, Live, Ask 不缓存当前页面
noodp Google, Yahoo, Live 不使用DMOZ的服务生成网站标题
noydir Yahoo 不使用Yahoo Directory生成网站标题
nosnippet Google 要求Google不根据当前页面文字内容生成网页描述
网站地图(sitemap)形式
书写形式
<?xml version=”1.0″ encoding=”UTF-8″ ?>
<url>
<loc>http://www.mysite.com/</loc>
<lastmod>2008-01-01</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
网络爬虫的记录痕迹及robot.txt书写法则
记录痕迹 Robot.txt 书写法则
Input Forms User-agent: *
Session IDs in URL Disallow: /privatefolder
Pages Restricted by Cookies Disallow: /privatefile.html
Frames User-agent: Googlebot/2.1
Logins Disallow: /nogoogle.html
网站地图(sitemap)存放地址
1.存放地址形式
http://www.pdsit.com/sitemap.xml
http://www.pdsit.com/sitemap.xml.gz
http://www.pdsit.com/sitemap.gz |