Was geht schneller, Strong- oder Light-Update?
Warum wird meine Website nicht mehr durch den Crawler besucht?
Dies geschieht typischerwiese, wenn ihr Provider Ihre Website verschoben hat.
Erstaunlicherweise geschieht dies sehr häufig! Überprüfen Sie bitte
sorgfältig, ob die Adresse Ihrer Website noch stimmt und tragen Sie die
erforderlichen Korrekturen nach.
Ich habe meine Website verändert. Wie kann ich sie reindizieren?
Loggen Sie sich in Ihr Control-Center ein. Navigieren Sie bitte zum Menü
Crawler > Crawler control und betätigen den Button 'Re-index'.
Ich verändere laufend meine Website. Kann die Reindizierung auch automatisch erfolgen?
Ja, die Crawl- und Indizier-Prozesse finden permanent statt, so dass jede
Seite im Suchindex nicht seltener als wöchentlich durch den Crawler besucht wird.
Dies geschieht vollkommen automatisch.
Ich habe bestimmte Seiten gelöscht, wie lang werden sie noch gefunden?
Die Indexeinträge, welche nicht neu importiert werden können (z.B. weil sie gelöscht wurden)
werden nach einer bestimmten Zeit aus dem Index entfernt. Die Standardeinstellung
beträgt 15 Tage (focus.conf: remove_older_than = 15), so dass bei wöchentlicher Indizierung zwei Versuche gemacht werden,
um die Einträge noch zu erneuern. Diese Einstellung darf nicht zu kurz sein, um zu
verhindern, dass die Seiten aus dem Index entfernt werden, wenn sie zum
Indizierungszeitpunkt z.B. aus netzwerktechnischen Gründen nicht erreichbar sind.
Wie findet der Crawler meine Seiten?
Der Suchmaschinen-Crawler startet mit der Web-Adresse (URL) die Sie bei der
Anmeldung angegeben haben. Er liest alle Links dieser Seite. Diejenigen
Links, die mit der selben URL starten wie die URL die Sie beim Anmelden
hinterlegt haben, werden weiter verfolgt und indiziert. Der Crawler überprüft
sodann alle diese Seiten und verfolgt Links der selben Domain und so weiter.
Wenn alle Seiten besucht sind, wird der Suchindex erzeugt und die Suche bringt
die jeweils aktuellsten Ergebnisse.
Kann ich eine Seite von der Indizierung ausschließen?
Ja, es gibt viele verschiedene Möglichkeiten, dies zu veranlassen:
- Verbieten Sie das Verzeichnis mit Ihrer robots.txt-Datei
- Verbieten Sie die Seite bzw. das Verzeichnis in Ihrem Control Center
- Fügen Sie den 'no-index' META-Tag zu Ihrer Seite hinzu.
Weitere Infos hierzu erhalten Sie in der Technical Library unterhalb des
Support-Menüs unserer Website.
Kann ich Teile einer Seite von der Indizierung auschließen?
Ja, fügen Sie bitte den Tag <insuma_ignore></insuma_ignore> um die
Stelle der Seite, die Sie von der Indizierung ausschließen möchten.
Dies ist sinnvoll für Website-Menüs, Nachrichtenticker und weitere Texte, welche
auf jeder Seite Ihrer Website auftauchen. Dieser Tag entspricht jedoch nicht dem HTML-Standard. Wenn es darauf ankommt, dass dem HTML-Standard entsprochen wird, dann kann auch diese Kommentarform verwendet werden:<!--insuma_ignore_begin-->
<!--insuma_ignore_end-->.
Kann mein Forum indiziert werden?
Ja, bitte achten Sie jedoch darauf, dass der Crawler nicht einen sogenannten
Crawler-Loop (Endlosschleife) gerät. Dies geschieht, wenn die selbe Seite mit
verschiedenen CGI-Paramtern angezeigt wird.
Weitere Infos hierzu erhalten Sie in der Technical Library unterhalb des
Support-Menüs unserer Website.
Berücksichtigt ihr Crawler meine "robots.txt"-Datei?
Ja, dies gilt immer.
Der Insuma-Crawler stellt sich selbst folgendermaßen vor:
InsumaScout/1.15
wobei 1.15 die aktuelle Versionsnummer angibt.
Welcher Teil einer Seite wird indiziert?
Standardmäßig werden Wörter der folgenden Abschnitte in den Index aufgenommen:
- title (Titel),
- keywords meta tag (Meta-Keywords),
- description meta tag (Meta-Descriptions),
- body (Body-Umgebung).
Der Crawler indiziert keine Wörter in Javascript-Umgebungen oder in den
Attributen zum Image-Tag "alt".
Was geht schneller, Strong- oder Light-Update?
Ein Strong-Update geht schneller und verursacht weniger Systemlast. Der Grund
dafür ist, dass das Strong-Update den Crawler-Verlauf vollständig löscht und
den Crawler neu startet. Das Light-Update versucht durch einen intelligenten
Vergleichsalgorithmus herauszufinden, ob sich zuvor gecrawlte Seiten verändert
haben und aktualisiert werden müssen. Wenn die zuvor gecrawlten Dokumente
keinen besonderen Wert für Sie haben und der Index möglichst schnell
aufgebaut werden soll, dann ist ein Strong-Update zu empfehlen.
Elvis jak z.ywy!
2007-08-14
Najwie;ksza wystawa eksponatów zwia;zanych z z.yciem Elvisa po raz pierwszy poza granicami USA. Od 13 sierpnia do 1 wrzes'nia moz.na ja; obejrzec' w Ellington Hotel Berlin. Na duz.ej powierzchni prezentowane jest ponad 100 eksponatów nalez.a;cych w przesz?os'ci do króla Rock'n'Rolla. Jedna; z najwie;kszych atrakcji sa; dotychczas niepublikowane zdje;cia Eda Bonja, który by? osobistym fotografem koncertowym...
Le moribond: Pourquoi pas, rien ne m'amuse comme la preuve de l'excès où les hommes ont pu porter sur ce point-là le fanatisme et l'imbécillité; ce sont des espèces d'écarts si prodigieux, que le tableau selon moi, quoique horrible, en est toujours intéressant. Réponds avec franchise et surtout bannis l'égoïsme. Si j'étais assez faible que de me laisser surprendre à tes ridicules systèmes sur l'existence fabuleuse de l'être qui me rend la religion nécessaire, sous quelle forme me conseillerais-tu de lui offrir un culte? Voudrais-tu que j'adoptasse les rêveries de Confucius, plutôt que les absurdités de Brahma, adorerais-je le grand serpent des nègres, l'astre des Péruviens ou le dieu des armées de Moïse, à laquelle des sectes de Mahomet voudrais-tu que je me rendisse, ou quelle hérésie de chrétiens serait selon toi préférable? Prends garde à ta réponse.