Sitemap.XML para Notícias e Artigos

Um Sitemap do Google Notícias é um arquivo que permite controlar o conteúdo enviado para o Google Notícias. Ao criar e enviar um Sitemap do Google Notícias, você ajuda o Google Notícias a descobrir e rastrear os artigos do seu site.

Tipo e Aplicações de Sitemap.XML

Sitemap.XML
Sitemap.XML para imagens
Sitemap.XML para mobile
Sitemap.XML para vídeos 

Benefícios:

• Descobrir artigos de notícias mais rapidamente: os Sitemaps permitem que o Google Notícias encontre rapidamente todos os artigos de notícias em um site.
• Rastrear e indexar todos os arquivos de notícias: Os Sitemaps apontam o nosso rastreador diretamente para cada URL de artigos de notícias, garantindo uma cobertura completa do conteúdo no seu site.
• Extrair e exibir as informações do artigo com mais precisão: os Sitemaps identificam os títulos dos artigos, bem como a data de publicação de cada um.
• Caracterizar o conteúdo do artigo com mais precisão: os Sitemaps especificam os diferentes tipos de conteúdo nos seus artigos usando <access> e <genres> tags.
• Fazer anotações em artigos com metadados: os Sitemaps identificam claramente o conteúdo de cada artigo com base em descrições específicas, como palavras-chave relacionadas ou códigos de ações da bolsa de valores.

Entenda a diferença

Os sitemaps de notícias são específicos para o Google Notícias!
Um Sitemap da web é diferente de um Sitemap de notícias porque não pode ser usado para enviar os seus artigos para o Google Notícias.
• Um Sitemap da web é uma lista dos URLs do seu site que você gostaria que o Google rastreasse. Já um Sitemap de notícias lista somente os artigos que foram publicados no seu site nos últimos dois dias. Você não deve incluir artigos mais antigos que isso.
• O Gerador de Sitemaps do Google não pode ser usado para criar um Sitemap de notícias, pois incluiria URLs que não correspondem a artigos de notícias específicos.
• Um Sitemap de notícias deve conter uma data de publicação para cada artigo. Essa data faz referência à primeira aparição do artigo no seu site. Certifique-se de que esta configuração não esteja definida automática para a hora “atual”.

Criando Sitemap.XML de notícias e artigos

Antes de iniciar, seu site deve estar incluído no Google Noticias. Caso não estiver e realmente não é qualquer site que pode ser incluso, você consegue enviar uma solicitação aqui. Um Sitemap de notícias não pode conter mais de 1.000 URLs, caso ultrapasse este limite, divida em diversos sitempas, e depois crie um sitemap, listando-os, conforme passarei no final deste artigo!

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
     xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
    <loc>http://www.example.org/business/article55.html</loc>
    <news:news>
         <news:publication>
        <news:name>Jornal de Exemplo</news:name>
        <news:language>en</news:language>
      </news:publication>
      <news:access>Subscription</news:access>
      <news:genres>PressRelease, Blog</news:genres>
      <news:publication_date>2008-12-23</news:publication_date>
      <news:title>Empresas A e B discutem fusão</news:title>
      <news:keywords>negócios, fusão, aquisição, A, B</news:keywords>
      <news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers>
    </news:news>
   </url>
</urlset>

Entendendo as Tag’s XML para notícias e artigos

Tag <publication>

Tag obrigatória, ela especifica a publicação em que o artigo aparece.
Ela possui duas tags filhas obrigatórias: <name> e <language>. A tag <name> é o nome da publicação da notícia, ela deve corresponder exatamente ao nome que aparece em seus artigos em news.google.com.br, omitindo quaisquer parênteses delimitadores. Por exemplo, se o nome aparece no Google Notícias como “Jornal de Exemplo (inscrição)”, use o nome “Jornal de Exemplo”. A tag <language> é o idioma de sua publicação. Ela deve seguir o Código de idiomas ISO 639.

Tag <access>

Esta tag deve ser usada somente se sua notícia ou artigo estiver somente disponível para usuários cadastrados em seu site, ou por trás de algum login e os usuários do Google não tiverem acesso.
Ela possui dois valores, que são “subscription” e “registration”

Tag <publication_date>

Tag obrigatória, nela você deve especificar data, hora, minutos e segundos e com o designador de fuso horário, certifique-se que essa informação seja a  hora exata da publicação no site e não do sitemap.xml.
O Google aceita qualquer um destes formatos:
Data completa
AAAA-MM-DD (por exemplo, 1997-07-16)
Data completa mais horas e minutos
AAAA-MM-DDThh:mmTZD (por exemplo, 1997-07-16T19:20+01:00)
Data completa mais horas, minutos e segundos
AAAA-MM-DDThh:mm:ssTZD (por exemplo, 1997-07-16T19:20:30+01:00)
Data completa mais horas, minutos, segundos e uma fração decimal de um segundo
AAAA-MM-DDThh:mm:ss.sTZD (por exemplo, 1997-07-16T19:20:30.45+01:00)

Tag <title>

Esta tag não é obrigatória, porém recomendo sua aplicação, devem incluir apenas o título do artigo como aparece em seu site. Certifique-se de não incluir o nome do autor ou da publicação ou a data da publicação como parte da tag de título.

Tag <news:geo_locations>

Tag não é obrigatória, porém no caso de notícias recomendo sua aplicação, ela pode ajudar o sistema do Google  a identificar a localização geográfica de seus artigos. Aplicar <news:geo_locations> poderá ser útil especialmente se você tiver uma seção de seu site dedicada à cobertura de um local específico que seja diferente do local principal de seu site. Você deve listar os locais partindo da menor entidade até a maior delas.
Por exemplo:

  • Cidade, estado, país
  • Província, país

Caso você tenha uma grande quantidade de notícias e artifos em seu site diariamente recomendo que você atualize continuamente seu Sitemap de notícias, conforme forem publicados. O Google Notícias rastreia os Sitemaps de notícias com a mesma frequência que rastreia o resto de seu site.