Sitemap.XML – Tudo que precisa saber

O que é um Sitemap.xml?

O Sitemap.XML é um protocolo onde você envia aos mecanismos de buscas todas as URL’s, imagens, vídeos e notícias (artigos) de seu site que você gostaria que eles encontrassem e indexassem.
Até mesmo um sitemap para Mobile como veremos adiante!
O Google adere ao Protocolo do Sitemap 0.9 como definido pela sitemaps.org. Sitemaps criados para o Google usando o protocolo do Sitemap 0.9 são compatíveis com os outros mecanismos de buscas, que adotam os padrões de sitemaps.org.
Ou seja tanto o Google quanto o Yahoo! e o Bing suportam o envio do Sitemap.XML
Lembrando que o envio de Sitempa.XML não garante que todas suas imagens, videos, notícias e URL’s sejam indexadas ele é apenas mais um complemento para ajudar na indexação, você estará dizendo ao Google algo assim:
“Google! Estas são minhas páginas de meu site essas são as imagens que contém nestas páginas, aqueles são os vídeos e estes são os artigos!”

Tipo e aplicações de Sitemaps

Sitemap.XML para Imagens
Sitemap.XML para Vídeos
Sitemap.XML para Móbile
Sitemap.XML para Artigos e Notícias 

Sitemap são úteis em casos de:

  • Seu site tem conteúdo dinâmico.
  • Seu site tem páginas que não são facilmente descobertos pelo Googlebot durante o processo de rastreamento, por exemplo, páginas com AJAX rico ou imagens.
  • Seu site é novo e tem poucas ligações com ele. (Googlebot rastreia a web seguindo os links de uma página para outra, por isso, se o site não estiver bem ligado, pode ser difícil para nós descobri-lo.)
  • Seu site tem um grande arquivo de páginas de conteúdo que não são bem ligados uns aos outros, ou não estão ligados em tudo.

 Criando o Sitemap.XML

O formato do protocolo Sitemap é composto por tags XML. O arquivo deve ser codificado em UTF-8

Iniciando seu sitemap

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns = "http://www.sitemap.org/schemas/sitemap/0.9">
      <url>
              <loc> http://www.meusite.com.br/ </loc
             <lastmod> 2012-09-11</lastmod>
             <changefreq> monthly </changefreq >
             <priority>1.0</priority>
       </url>
</urlset>

Entendendo as tag XML

Tag <urlset>

Esta tag é obrigatória e faz referência ao padrão do protocolo.

Tag <url>

Esta tag é obrigatória e ele encapsula todos os atributos <loc> seguido de sua URL listadas no sitemap

Tag <loc>

Esta tag é obrigatória, ela encapsula a URL da página, esta URL deve começar sempre com http:// e não deve passar de 2.048 caracteres.

Tag <lastmod>

Esta tag não é obrigatória e nele você coloca a data da ultima alteração no arquivo caso não saiba não use-o o formato da data deve ser AAAA-MM-DD.

Tag <changefreq>

Esta tag não é obrigatória, nele você deve especificar a frequência com a qual você altera o conteúdo, os valores válidos neste atributo são.:  always, hourly, daily, weekly, monthly, yearly e never.

Always

O valor Always (sempre) deve ser usado somente se você faz alterações a cada vez que você acessa a página.

Hourly

O valor Hourly (de hora em hora) deve ser usado somente se você faz alterações constantes de hora em hora.

Dayli

O Valor Dayli (diário) deve ser usado apenas se você faz alterações diariamente.

Wekly

O valor Wekly (semanal) deve ser usado caso você faça alterações semanais em seu conteúdo.

Monthly

O valor Monthly (mensal) deve ser usado caso você faça alterações mensais.

Yearly

O valor Yearly (anual) deve ser usado caso você faça alterações no máximo 1 vez ao ano.

Never

O valor Never (nunca) deve ser usado em casos de URL arquivadas
Dica*
Lembrando que essa tag não tem valor algum para o Google, é apenas uma dica para o Google e não um comando, este atributo não vai fazer com que o Google passe em determinada página porque você estipulou a ele que você altera o conteúdo diariamente, então não perca seu precioso tempo com estes valores!

Atributo <priority>

Neste atributo você qualifica a prioridade de cada URL. Os valores são dados de 0,0 a 1,0. Este valor não impacta em ranqueamento, então nem tente atribuir 1,0 em todas as páginas isso não irá ajudar. Uma dica é que não perca seu tempo com este atributo!

Sitemap.XML para Sitemaps

O formato XML de um arquivo de índice de Sitemaps é bastante similar ao formato XML de um arquivo de Sitemap. O arquivo de índice de Sitemaps usa as seguintes tags XML:

  • <sitemapindex> – a tag pai que inicia e finaliza o arquivo.
  • <sitemap> – a tag pai para cada Sitemap relacionado no arquivo (filha de <sitemapindex>)
  • <loc> – a localização do Sitemap (uma tag filha de <sitemap>)
  • <lastmod> – a última data modificada do Sitemap (opcional)

Como ficaria seu Sitemap.XML para Sitemaps

<?xml version="1.0" encoding="UTF-8"?>
   <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.example.com/sitemap1.xml.gz</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap2.xml.gz</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
   </sitemapindex>

Usando o Robots.txt

Usando o arquivo robots.txt

Você pode dizer o Google e outros motores de busca sobre o seu Sitemap, adicionando a seguinte linha ao seu arquivo robots.txt:

Sitemap: http://example.com/sitemap_location.xml