Meta-Tags sind Zusatzangaben im Head-Bereich der HTML-Datei. Sie sind nicht einheitlich standardisiert, dennoch gibt es eine ganze Reihe festgelegter Meta-Tags, die sinnvoll zu verwenden sind.
Es können Anweisungen für Browser, Server und Such-Robots angegeben werden.
Der Einsatz von Meta-Tags ist freiwillig. Schätzungsweise 20% aller Webseiten enthalten den Meta-Tag keywords.
Meta-Tags sind Angaben für eine einzelne Webseite.
In einer Domain sollten die einzelnen Seiten unterschiedliche Schlüsselworte und Beschreibungstexte enthalten, genau auf diese Seite zugeschnitten.
Gemeinsame Richtlinien für robots Meta-Tags, die von Yahoo!, Google und Microsoft im Jahr 2008 entworfen wurden
RICHTLINIE |
WIRKUNG |
EINSATZMÖGLICHKEITEN UND CODE-BEISPIEL |
NOINDEX META Tag |
Veranlasst den Crawler, eine bestimmte Seite nicht zu indexieren. |
Seiten sollen nicht indexiert werden. Dies ermöglicht es, dass Seiten, die gecrawlt wurden, nicht in den Index aufgenommen werden.
<meta name=”robots” content=”noindex”>
|
NOFOLLOW META Tag |
Sagt dem Crawler, dass er einem Link zu anderem Inhalt auf einer bestimmten Seite nicht folgen soll. |
Schützt Bereiche, die öffentlich zugänglich sind, davor, von Spammern zu Linkzwecken missbraucht zu werden. Indem Sie NOFOLLOW einsetzen, lassen Sie den Robot wissen, dass alle Links dieser Seite nicht für das Ranking berücksichtigt werden sollen.
PageRank wird nicht weitergegeben.<meta name=”robots” content=”nofollow”> |
NOSNIPPET META Tag |
Sagt dem Crawler, dass Snippets für eine bestimmte Seite in den Suchergebnissen nicht anzeigt werden sollen. |
Es soll kein Snippet für eine Seite in den Suchergebnissen angezeigt werden.
<meta name=”robots” content=”nosnippet”>
|
NOARCHIVE META Tag |
Sagt der Suchmaschine, dass für eine bstimmte Seite kein “Im Cache” Link angezeigt werden soll. |
Den Nutzern soll keine Kopie der Seite im Cache der Suchmaschine zur Verfügung gestellt werden.
<meta name=”robots” content=”noarchive”>
|
NOODP META Tag |
Sagt dem Crawler, dass für eine bestimmte Seite nicht der Titel und das Snippet des Open Directory Projects verwendet werden soll. |
Für eine bestimmte Seite soll nicht der Titel und das Snippet aus dem ODP (Open Directory Project) verwendet werden.
<meta name=”robots” content=”noodp”>
|
Meta-Tags für Suchmaschinen
Beschreibung der Seite
<meta name=”description” content=” Beschreibungstext “>Der Beschreibungstext der hier aufgeführt wird, ist natürlich so unterschiedlich, wie jede Webseite selbst. Er soll möglichst präzise und prägnant den Inhalt der Webseite beschreiben. Es darf und soll für jede einzelnen Webseite eine andere Beschreibung verwendet werden.. Die Beschreibung soll max. 2-3 Sätze lang sein. Bei den meisten Suchmaschinen werden max. 250 Zeichen angezeigt, es gibt einige die nur 80 Zeichen zulassen. Wenn der Meta-Tag Content-Type definiert wurde, sind auch Umlaute in der Seitenbeschreibung zugelassen.
Ist kein Meta-Tag description vorhanden, wird in der Regel ein Snippet aus dem Seitentext generiert. Das Snippet enthält den Suchbegriff sowie einige Worte vor und nach dem Suchbegriff.
Schlüsselwörter ( keywords)
<meta name=”keywords” content=”Schlüsselwörter”>Das sind die Begriffe, die man der Suchmaschine zur Verfügung stellt, um vom Suchenden gefunden zu werden.
Die Bedeutung des Meta-Tag keywords ist extrem gesunken, weil er zu häufig missbraucht wird. Die Inhalte des Meta-Tags bleiben für Besucher unsichtbar. Verschwenden Sie bitte nicht unnötig Zeit, den Meta-Tag keywords zu befüllen. Für das Ranking in wichtigen Internet-Suchmaschinen ist der Meta-Tag keywords bedeutungslos.
In Firmennetzwerken oder für den Einsatz einfacher Site-Suchmaschinen kann der Meta-Tag keywords weiterhin Bedeutung haben. Im Prinzip überall dort wo kein Missbrauch zu befürchten ist. Dort wo kontrolliert werden kann, wer welche Inhalte publiziert.
Hier kommt es für den HTML-Autor darauf an, sich möglichst genau in die Lage des Suchenden zu versetzen um möglichst die Begriffe zu definieren, nach denen gesucht wird. Das sind natürlich Fachbegriffe, aber viele Suchende haben diese in dem Moment wo sie einen Begriff in der Suchmaschine eingeben, gerade nicht abrufbereit und geben dann ähnliche Begriffe ein. Tippfehler anzugeben wie z.B. Lnk (statt Link) kann mitunter hifreich sein. Meine Empfehlung: Setzen Sie sich einfach mal vor eine Suchmaschine und überlegen, mit welchen Begriffen Sie Ihre Webseiten suchen würden.
Der Content von keywords sollte nicht länger als 20 Worte sein. Hier heisst es, weniger ist mehr. Variationen eines Wortes sind in der Regel zulässig, trotzdem sehr vorsichtig zu verwenden.
Erfassen der Webseite ermöglichen – Richtlinien für Robots
Die Meta-Tags für Robots, Crawler,.. sind lediglich Empfehlungen. Ob sich die Such-Agenten tatsächlich daran halten, können Sie nicht beeinflussen. Die grossen wichtigen Suchmaschinen werden es inder Regel tun.
<meta name=”robots” content=”index,follow”>Mit dem Schlüsselwort “index” werden die Robots angewiesen, diese Seite zu indizieren. “follow” gestattet dem Robot, die auf der Seite enthaltenen Links zu verfolgen.
Wird dieser Meta-Tag nicht eingesetzt hat es die selbe Wirkung:
Die Seite wird indiziert, alle Links werden verfolgt.
Folgerichtig sind die Schlüsselwörter “noindex” und “nofollow” genau dann einzusetzen, wenn man den jeweiligen Vorgang unterbinden möchte. Beispielsweise in einem Frameset sollte Sie die Navigationsseite vom Indizieren ausschliessen, aber den Robots gestatten, die Links zu verfolgen: noindex,follow
Seiten nicht im Cache speichern
<meta name=”robots” content=”noarchive”>Unterstützt von Google, Yahoo! und Microsoft. Seiten werden weiterhin indexiert und ein Auszug der Seite wird als Beschreibungstext des Treffers angezeigt. Nutzer können jedoch nicht (mehr) über den Link auf der Ergebnisseite “Im Cache” auf die zwischengespeicherte Version der Seite zugreifen.
Keine Beschreibung aus Verzeichnissen anzeigen
In einigen Situationen entscheiden Suchmaschinen, Titel und Beschreibung aus einem Webverzeichnis anzuzeigen. Der zutreffende Meta-Tag kann das verhindern.
NOODP – unterstützt von Google, Yahoo! und Microsoft – Keine Inhalte vom ODP für die Anzeige in der Ergebnisliste verwenden.
<meta name=”robots” content=”noodp”>NOYDIR – Unterstützt von Yahoo!. Keine Inhalte aus dem Yahoo! Verzeichnis für die Anzeige in der Ergebnisliste verwenden.
<meta name=”robots” content=”noydir”>
Verfallsdatum für Webseiten
Seit Juli 2007 vespricht Google folgenden Meta-Tag zu berücksichtigen:
<META NAME=”GOOGLEBOT” CONTENT=”unavailable_after: 25-Aug-2007 15:00:00 GMT”>Das Verfallsdatum soll nach obigem Muster geschrieben werden. Es gelten die Regeln von RFC 850 . Dieser Meta-Tag kannn z. b. für kurzfristige oder saisonale Angebote interessant sein. Ist ein Produkt nicht mehr im Angebot oder Beiträge einer Online-Zeitung wandern in das kostenpflichtige Archiv, kann dieser Meta-Tag eingesetzt werden. Siehe auch Beitrag: Verfallsdatum für Websites verkünden.
Keine Bilder in den Index aufnehmen
Google unterstützt “noimageindex“. Die Bilder der Seiten werden dennoch in den Google-Index aufgenommen. Ein verkleinertes Bild, häufig auch Thumbnail genannt, wird in der Google Bildersuche gezeigt. Verhindert wird lediglich, dass ein Nutzer auf die Quelldatei weitergeleitet wird.
<meta name=”robots” content=”noimageindex”>
Website soll nicht übersetzt werden
Die Google Übersetzung kann wie folgt verhindert werden:
<meta name=”google” value=”notranslate”>
Robot, besuch meine Website mal wieder
<meta name=”revisit-after” content=”30 days”>Content gibt an nach wieviel Tagen der Robot zur Indizierung wieder vorbeischauen soll.
Dieser Meta-Tag ist ziemlich nutzlos. Sie können sicher sein, dass sich keine Suchmaschine daran hält!!!!
Suchmaschinen werden generell nach eigenen Plänen eine Webseite wiederbesuchen. Einige haben feste Intervalle, andere ermitteln anhand der Änderungsfolge einer Webseite ob diese demnächst in kürzeren Intervallen besucht wird.
Content kann als month ( Monate ) , weeks (Wochen) und days (Tage) angegeben werden. Besser, Sie sparen Ihre Kräfte für andere Aufgaben und setzen diesen Meta-Tag gar nicht ein.
Meta-Tags für Browser
Angabe der Inhaltskategorie
<meta http-equiv=”content-type” content=”text/html; charset=iso-8859-1″>Mit diesem Meta-Tag wird festgelegt, daß es sich um eine Anweisung für Browser handelt ( meta http-eqiv=”"). Weiterhin erfolgt die Angabe um welchen Dateityp es sich handelt ( content=”text/html; ) und welcher Zeichensatz in der Datei verwendet wird ( charset=iso-8859-1″ ). Bei ISO-8859-1 handelt es sich um den Westeuropäischen Zeichensatz.
Diese Angabe sichert die richtige Anzeige von Umlauten auch wenn sie im Text nicht extra maskiert wurden. Sie sollte als erster Meta-Tag aufgeführt werden.
Speichern von Seiten verhindern
<meta http-equiv=”pragma” content=”no-cache”><meta http-equiv=”expires” content=”0″>
<meta http-equiv=”cache-control” content=”no-cache”>Das kann für Seiten sinnvoll sein deren Inhalt sich oft ändert, z.B. aktuelle News, Seiten die täglich aktualisiert werden, oder Inhalte bei denen man vermeiden möchte, daß sie in einem Cache-Speicher landen. Das Zwischenspeichern ist andererseits eine gute Hilfe um den Traffic im Web zu verringern. Bei den derzeitigen Bandbreiten im Web hat jeder Nutzer etwas vom Cache, deshalb sollte im Einzelfall geprüft werden, ob es wirklich notwendig ist, diesen Metatag anzuwenden.
Am http-equiv ist zu erkennen, daß es sich um eine Anweisung für den Browser handelt.
pragma: verhindert das Speichern der Seite im Cache-Speicher Des Proxy-Server.
no-cache: verhindert das Speichern der Seite im Browsercache.
expiries: siehe Ablaufdatum.
Ablaufdatum der Datei
<META HTTP-EQUIV=”expires” CONTENT=”Wed, 26 Feb 1997 08:21:57 GMT”>Nach dem im Content aufgeführten Datum soll der Robot wiederkommen, weil der inhaltliche Wert der Webseite sich in dieser Zeit so geändert hat, dass eine Neuindizierung sinnvoll ist. Das Datum muss im internationalen Format gesetzt werden. Siehe auch: W3C Recommendations
Den Glauben, dass sich Robots daran halten, sollte man nicht zu hoch ansetzen. Die Angaben haben aber für Webbrowser eine Bedeutung und bewirken, dass die Seite zum gewählten Zeitpunkt nicht mehr aus dem Browsercache, sonder erneut geladen wird.
Die Sprache der Seite definieren:
<meta http-equiv=”language” content=”de”>Auch ein Metatag für den Browser (http-equiv)
Es sind diverse Sprachangaben möglich z.B.:
en – englisch
fr – französisch
es -spanisch
in der Regel wird die Sprache vom Browser korrekt interpretiert. Es gibt die Möglichkeit bei der Betrachtung einer Datei im Browser unter Ansicht-Codierung einen Zeichensatz auszuwählen, falls keine korrekte Darstellung der Zeichen erfolgt.
Insbesondere für andere Schriftarten wie chinesich oder kyrillisch wird es erforderlich, die entsprechenden Zeichensätze zu installieren, um die Schrift korrekt anzeigen zu können.
Einige landesspezifische Suchmaschinen erfassen Webseiten nur in einer bestimmten Sprache.
Allgemeine Meta-Tags
Nachfolgend weitere Meta-Tags, die verschiedene allgemeine Angaben beinhalten, welche besonders bei der Publikation von wissenschaftlichen Arbeiten eine Rolle spielen. Die Arbeiten können damit besser katalogisiert werden. In allgemeinen Suchmaschinen finden die Angaben keine Berücksichtigung:
Autor der Seite
<meta name=”author” content=”Erik G”>Der Verfasser der Seite wird hier genannt.
Wer ist Ansprechpartner der Website ?
<link rev=”made” content=”mailto:nospam@at-web.de”>Unter Content kann der Ansprechpartner oder die eMail-Adresse des Webmaster oder des für den Inhalt der Webseite Verantwortlichen angegeben werden.
Erstellungdatum der Datei
<meta name=”date” content=”2000-03-16T11:49:37+00:00″>Vor dem Buchstaben T (Time) steht das eigentliche Datum, hier der 16.März 2000. Das Datum kann separat eingesetzt werden, die Angabe ab T ist optional und gibt die Uhrzeit an. Nach dem Pluszeichen kann bei Bedarf noch die Abweichung von der Greenwich-Zeit angegeben werden.
Herausgeber
<meta name=”publisher” content=”@-web”>Ist in der Regel die Firma, die diese Seiten publiziert.
Das Urheberrecht angeben
<meta name=”copyright” content=”@-web”>Wer sich mit dem Urheberrecht tiefer beschäftigen möchte wird auch zu anderen Rechtsfragen auf folgender Website gut informiert:
http://www.online-recht.de/
Seitenthema
<meta name=”page-topic” Content=”Dienstleistung, Internet”>Das übergeordnete Thema der Seite angeben
Seitentyp
<meta name=”page-type” content=”Verzeichnis”>Angabe was auf der Seite angeboten wird, z.B. Katalog, Verzeichnis, Überblick,….
Zielgruppe die angesprochen werden soll
<meta name=”audience” Content=”Anfänger, Fortgeschrittene, Programmierer,…”>Das anzusprechende Publikum.
Angabe des HTML-Editors
<meta name=”generator” content=”Allaire HomeSite “>Wird von vielen Programmen ( besonders WISYWIG-Editoren) selbständig generiert. Auch diese Angabe können Sie getrost weglassen.
Dublin Core
Eine weitere Gruppe von Meta-Angaben, die von einer internationalen Expertengruppe – die sich Dublin Core nennt -ausgearbeitet wurden. Diese werden auch vom W3-Konsortium unterstützt. Suchmaschinen sind für diese Angaben aber meistens noch nicht gerüstet, so daß die Zukunft zeigen wird, wann und wie Meta-Tags nach D.C. im Internet eingesetzt werden. Bibliotheken und andere Einrichtungen klassifizieren ihre Webseiten jedoch sehr gerne nach Dublin Core. Für weitere Informationen besuchen Sie folgende englischsprachige URL:
dublin_core
Umfangreiche Meta-Tag Sammlung
Was meinen Sie ? Es gibt noch viel mehr Meta-Tags ? Na klar. Möchten Sie wirklich umfangreich informiert werden ? Ich empfehle Ihnen eine umfassende Sammlung zu Meta-Tags in englischer Sprache:
• Wörterbuch für Meta-Tags:
vancouver-webpages
• Noch mehr Infos zu Meta-Tags:
Webdesign Group: Metadata
• Hinweise des W3C-Konsortium wie man Suchmaschinen beim Indexieren der Webseite behilflich sein kann:
Notes on helping search engines index your Web site
• Meta-Daten und Labels zum Kinder und Jugendschutz: PICS (Platform for Internet Content Selection)
VN:F [1.9.22_1171]