O que é um Sitemap.xml?
O Sitemap.XML é um protocolo onde você envia aos mecanismos de buscas todas as URL’s, imagens, vídeos e notícias (artigos) de seu site que você gostaria que eles encontrassem e indexassem.
Até mesmo um sitemap para Mobile como veremos adiante!
O Google adere ao Protocolo do Sitemap 0.9 como definido pela sitemaps.org. Sitemaps criados para o Google usando o protocolo do Sitemap 0.9 são compatíveis com os outros mecanismos de buscas, que adotam os padrões de sitemaps.org.
Ou seja tanto o Google quanto o Yahoo! e o Bing suportam o envio do Sitemap.XML
Lembrando que o envio de Sitempa.XML não garante que todas suas imagens, videos, notícias e URL’s sejam indexadas ele é apenas mais um complemento para ajudar na indexação, você estará dizendo ao Google algo assim:
“Google! Estas são minhas páginas de meu site essas são as imagens que contém nestas páginas, aqueles são os vídeos e estes são os artigos!”
Tipo e aplicações de Sitemaps
Sitemap.XML para Imagens
Sitemap.XML para Vídeos
Sitemap.XML para Móbile
Sitemap.XML para Artigos e Notícias
Sitemap são úteis em casos de:
- Seu site tem conteúdo dinâmico.
- Seu site tem páginas que não são facilmente descobertos pelo Googlebot durante o processo de rastreamento, por exemplo, páginas com AJAX rico ou imagens.
- Seu site é novo e tem poucas ligações com ele. (Googlebot rastreia a web seguindo os links de uma página para outra, por isso, se o site não estiver bem ligado, pode ser difícil para nós descobri-lo.)
- Seu site tem um grande arquivo de páginas de conteúdo que não são bem ligados uns aos outros, ou não estão ligados em tudo.
Criando o Sitemap.XML
O formato do protocolo Sitemap é composto por tags XML. O arquivo deve ser codificado em UTF-8
Iniciando seu sitemap
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns = "http://www.sitemap.org/schemas/sitemap/0.9"> <url> <loc> http://www.meusite.com.br/ </loc <lastmod> 2012-09-11</lastmod> <changefreq> monthly </changefreq > <priority>1.0</priority> </url> </urlset>
Entendendo as tag XML
Tag <urlset>
Esta tag é obrigatória e faz referência ao padrão do protocolo.
Tag <url>
Esta tag é obrigatória e ele encapsula todos os atributos <loc> seguido de sua URL listadas no sitemap
Tag <loc>
Esta tag é obrigatória, ela encapsula a URL da página, esta URL deve começar sempre com http:// e não deve passar de 2.048 caracteres.
Tag <lastmod>
Esta tag não é obrigatória e nele você coloca a data da ultima alteração no arquivo caso não saiba não use-o o formato da data deve ser AAAA-MM-DD.
Tag <changefreq>
Esta tag não é obrigatória, nele você deve especificar a frequência com a qual você altera o conteúdo, os valores válidos neste atributo são.: always, hourly, daily, weekly, monthly, yearly e never.
Always
O valor Always (sempre) deve ser usado somente se você faz alterações a cada vez que você acessa a página.
Hourly
O valor Hourly (de hora em hora) deve ser usado somente se você faz alterações constantes de hora em hora.
Dayli
O Valor Dayli (diário) deve ser usado apenas se você faz alterações diariamente.
Wekly
O valor Wekly (semanal) deve ser usado caso você faça alterações semanais em seu conteúdo.
Monthly
O valor Monthly (mensal) deve ser usado caso você faça alterações mensais.
Yearly
O valor Yearly (anual) deve ser usado caso você faça alterações no máximo 1 vez ao ano.
Never
O valor Never (nunca) deve ser usado em casos de URL arquivadas
Dica*
Lembrando que essa tag não tem valor algum para o Google, é apenas uma dica para o Google e não um comando, este atributo não vai fazer com que o Google passe em determinada página porque você estipulou a ele que você altera o conteúdo diariamente, então não perca seu precioso tempo com estes valores!
Atributo <priority>
Neste atributo você qualifica a prioridade de cada URL. Os valores são dados de 0,0 a 1,0. Este valor não impacta em ranqueamento, então nem tente atribuir 1,0 em todas as páginas isso não irá ajudar. Uma dica é que não perca seu tempo com este atributo!
Sitemap.XML para Sitemaps
O formato XML de um arquivo de índice de Sitemaps é bastante similar ao formato XML de um arquivo de Sitemap. O arquivo de índice de Sitemaps usa as seguintes tags XML:
- <sitemapindex> – a tag pai que inicia e finaliza o arquivo.
- <sitemap> – a tag pai para cada Sitemap relacionado no arquivo (filha de <sitemapindex>)
- <loc> – a localização do Sitemap (uma tag filha de <sitemap>)
- <lastmod> – a última data modificada do Sitemap (opcional)
Como ficaria seu Sitemap.XML para Sitemaps
<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod>2004-10-01T18:23:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap> </sitemapindex>
Usando o Robots.txt
Usando o arquivo robots.txt
Você pode dizer o Google e outros motores de busca sobre o seu Sitemap, adicionando a seguinte linha ao seu arquivo robots.txt:
Sitemap: http://example.com/sitemap_location.xml