Kategorie Über findo.de
Eine kleine Zeitreise ...
AvOe - 04 Februar 2008
Kategorie Über findo.de

... durch die optische Geschichte von findo.de.

  1. Entwurf "Katalog" (2006)
    Ursprünglich wurde findo.de als Katalog für Domains in Deutschland gegründet (findo = find domains). Das darauf basierende Suchverfahren klassifizierte automatisiert alle Domains anhand von Wortfeldern in Kategorien und indizierte die wichtigsten Begriffe. Vorteil: Sehr "saubere" Ergebnisse, Nachteil: zu kleiner Index - eine Nachrichten Webseite wurde als solche klassifiziert und nicht als Seite zum Thema "Merkel", "Afghanistan" etc ...
     
  2. Entwurf "Nachrichten Suchmaschine V1"
    Aufgrund des extrem hohen Datenvolumens und fehlender Zeit mutierte findo.de mit der Zeit immer mehr zur Nachrichten Suchmaschine. Dadurch, dass viele der indizierten Domain ohnehin redaktionelle Quellen waren konnte der Übergang relativ einfach gestaltet werden.
     
  3. Entwurf "Nachrichten Suchmaschine V2"
    ..es wuchs und wuchs ...
     
  4. Aktuell (Version 3)

Die Nachrichten Suchmaschine findo.de
AvOe - 31 Oktober 2007
Kategorie Über findo.de
findo.de ist eine neue Nachrichten Suchmaschine in Deutschland und wird als Forschungsprojekt von der stradego GmbH aus Aachen betrieben. Gestartet wurde mit der Indizierung von Nachrichten im Oktober 2006. Seit dem hat sich das Portal und die Technologie im Hintergrund stets verbessert:

Grid-Technologie:
Alle Spider-Aufgaben zum sammeln und bewerten der Daten sowie Wartungs- und Indizierungs-Aufgaben in der Datenbank werden von sogenannten Grid-Clients vollzogen, d.h. Programmen die auf ausgelagerten Computern installiert sind und die Aufgaben, Datenpackete sowie die Rechenlogik vom Server zugewiesen bekommen. Dadurch werden alle Vorteile verteilter Rechensysteme genutzt.

Text-Algorithmen: Es wurden Algorithmen entwickelt zur inhaltlichen Text-Reduktion und Stichwort Erkennung sowie inhaltlicher Text-Gruppierung. Dadurch bietet findo.de neue Suchoptionen wie z.B. die Umfeldsuche.

Ziele von findo.de
AvOe - 19 Oktober 2007
Kategorie Über findo.de

Was findo.de ist:

  • Nachrichten Suchmaschine
  • Umfangreiche, unabhängige Recherchequelle im Bereiche Presse & Nachrichten

Was findo.de nicht ist:

  • Web 2.0, innovativste Suchmaschine, next generation, BETA

Was findo.de sein möchte:

  • Nachrichten Suchmaschine mit der umfangreichsten Datenbasis in Deutschland.
Für Verleger & Webmaster
AvOe - 19 Oktober 2007
Kategorie Über findo.de

findo.de für Sie und Ihre Vorteile

findo.de ist eine Nachrichten-Suchmaschine. Dies bedeutet, dass öffentlich erreichbare Nachrichten von Medienseiten indiziert und durch ein Deep-Link dem Benutzer nach Datum, Thema oder Quelle sowie auf Suchanfrage bereit gestellt werden. Alle Nachrichten sind eindeutig mit dem Urheber gekennzeichnet und werden direkt zu der Quellseite weitergeleitet. Es werden nur die Informationen indiziert, die von der Quelle zur Syndication bereitgestellt werden, es werden keine weiteren Daten indiziert. findo.de ist somit praktisch ein "Vertriebler" Ihrer Nachrichten/Links und vermittelt Ihnen Besucher.

Indizierung

findo.de durchsucht das deutsche Web nach Nachrichten-Feeds und indiziert diese sofern keine entsprechende Direktive gemäß Robots Exclusion Standard definiert ist. Hierbei können, wie bei jedem IT-System, Fehler unterlaufen. In diesem Fall korrigieren wir diesen zeitnah und entfernen Ihre Inhalte. Da aus Performance-Gründen nicht bei jedem Aufruf die "robots.txt" geprüft wird, kann es nach Einführung einer entsprechenden Direktive ein wenig dauern bis diese Wirkung zeigt. 

Der findo.de-Bot

Der findo.de-Bot identifiziert sich als:
Mozilla/5.0 (compatible; findoBot/1.0; +http://www.findo.de)

Wenn Sie nicht möchten, dass findo.de Ihre Nachrichten oder Ihre Webseite indiziert, so können Sie gemäß dem internationalen Robots Exclusion Standard folgende Direktiven nutzen:
User-agent: findoBot
Disallow: /

oder
User-agent: findoBot
Disallow: [hier eine konkrete URL]


Sie können anstelle der "findoBot" Direktive auch "findo", "findo.de" bzw. die für alle Suchmaschinen gültige Direktive "*" nutzen.

Anfragen auf Ihrer Webseite

Die derzeitige Reload-Zeitspanne liegt bei 30 Minuten. Dadurch werden pro Tag ca. 48 Anfragen auf Ihrem Server erzeugt.

Hinzufügen oder löschen

Sie können bei findo.de keine einzelnen News hinzufügen. Es können lediglich Nachrichten-Quellen (Webseiten) mit konstant neuen Nachrichten aufgenommen werden. Das Löschen von Nachrichten ist gemäß der Nutzungsbedingungen von findo.de in begründeten Fällen möglich.

Update: Seit März 2008 bietet findo.de ein teilweise automatisiertes Löschantrags-Verfahren an. Dadurch können Nachrichten Ihrer Webseite zeitnah aus dem Index entfernt werden.

Kategorien
Vorherige Einträge
» Ähnliche Artikel
» Olympia: Das wars ...
» Performance verbessert
» (Wartungsfenster erfolgreich abgeschlossen)
» Server-Upgrade kurzfristig verschoben
» Backend optimiert
» Pluralisierung
» "Ähnliche Artikel"
» Systeme wieder stabil
» 8.8.08 - Relaunch vollzogen
Nach Kalendertag
März 2010
MDMDFSS 
  1  2  3  4  5  6  7 
  8  91011121314 
15161718192021 
22232425262728 
293031     
        
Weitere Links