Einsatz von FirstSpirit Website Crawl bei der SharePoint Enterprise Suche

Die Einbindung von Inhaltsquellen in die SharePoint Enterprise Suche kann den Administrator vor unvorhersehbare Herausforderungen stellen. Die Indizierung eines Intranets sollte so im Standard über die Einbindung als Website eigentlich kein Problem darstellen. Funktioniert dies dann nicht, beginnt eine teils zeitintensive Fehler- und Lösungssuche. So erwartet SharePoint bei der initialen Verbindung zu einer zu indizierenden Webseite einen HTTP 200 Returncode.

Bei Indizierung eines Intranets auf Basis von FirstSpirit wird jedoch bei erstmaliger Verbindung ohne gesetztem Cookie erst ein HTTP 202 zurückgegeben. In der Dokumentation für Administratoren FirstSpirit™ 2018-07 steht hierzu der folgende Vermerk:

“Vor FirstSpirit-Version 5.2R2 wurde ACCEPTED (202) gesendet. Abhängig von der eingesetzten Infrastruktur wird dieser Status (202) nicht als „gültig“ akzeptiert, was beispielsweise zu Problemen bei der Indizierung führen kann (bekanntes Problem: SharePoint Crawler unter Windows). Das Standardverhalten wurde daher mit 5.2R2 umgestellt.”

Quelle: https://docs.e-spirit.com/odfs/dokumentation/administratore/ADMI_DE_FirstSpirit_Administrators.pdf

Das Verhalten ist über die IE Entwicklertools belegbar, die Webseite wird so von SharePoint nicht gecrawled, der Vorgang bricht ab.

Auch die Konfiguration einer Crawl-Regel unter Verwendung der Cookie Authentifizierung funktioniert nicht, hier ist ebenfalls der initiale Aufbau durch den fehlenden HTTP 200 nicht möglich.

Lösung ist hier das Schreiben eines kurzen PowerShell-Skriptes, welches über die Windows Server Aufgabenplanung, alternativ zur Regelplanung, regelmäßig gestartet werden kann.

Das Skript öffnet über einen Invoke-WebRequest zunächst die erste Seite des Intranets und liest den notwendigen Cookie JSESSIONID aus. Im Anschluss wird der Cookie der Suchkonfiguration näher der Crawl Regel hinzugefügt und der Crawl gestartet. Durch den gesetzten Cookie wird dann beim ersten Crawl-Zugriff der notwendige HTTP 200 zurückgegeben und die Webseite kann indiziert werden.

Erfahren Sie mehr

Office 365 Groups als Evolution von SharePoint?
Blog
Blog

Office 365 Groups als Evolution von SharePoint?

Zusätzlich zu SharePoint erlauben die Office 365 Groups es mir als Anwender, schnell und einfach neue Gruppen anzulegen und selbständig Benutzer hinzuzufügen.

Das neuste Mitglied der Office 365 Familie: Delve
Blog
Blog

Das neuste Mitglied der Office 365 Familie: Delve

Microsoft legt nach: Mit Delve startet eine neue Form des Suchens und des Auffinden von Dokumenten und Informationen.

Nov
07
Webcast mit Microsoft: Das Intranet zu Ende gedacht
Webinar
Webinar

Webcast mit Microsoft: Das Intranet zu Ende gedacht

Am 07. November findet erneut eines unserer Webinare gemeinsam mit Mircosoft statt. Das Thema dieses Mal: Das Intranet zu Ende gedacht – Die Informationszentral...

Sprechen Sie LUIS? – Der intelligente Chat-Bot im Praxistest
Blog
Blog

Sprechen Sie LUIS? – Der intelligente Chat-Bot im Praxistest

Mit LUIS, der Sprach- und Texterkennungssoftware von Microsoft, und dem Bot Framework von Azure haben wir eine Lösung für den IT-Support entwickelt.

Auf Goldkurs in der Cloud
News
News

Auf Goldkurs in der Cloud

Die novaCapta hat ihren Partnerstatus bei Microsoft zusätzlich vergoldet: Auch in der Sparte Cloud Productivity haben wir jetzt den Goldstatus.

Valo ist neuer Partner der novaCapta für Intranets
News
News

Valo ist neuer Partner der novaCapta für Intranets

Durch die Partnerschaft mit Valo, dem Ready-2-Go Intranet-Baukasten aus Finnland baut die novaCapta ihr Angebot bei der Umsetzung von schnellen und funktionalen...

novaCapta auf der Fachtagung für Interne Revision
Event
Event

novaCapta auf der Fachtagung für Interne Revision

Das Expertenteam der novaCapta präsentiert am 15. und 16. November ihre innovative Audit Management Lösung auf dem DIIR-Kongress in Dresden. Besuchen Sie unsere...

Ich bin im Flow! – Eine Übersicht zu Microsoft Flow
Blog
Blog

Ich bin im Flow! – Eine Übersicht zu Microsoft Flow

Die Power Platform wird aktuell von Microsoft sehr stark gepusht. Zeit, sich mit dem Potenzial der einzelnen Komponenten zu beschäftigen. Heute: Flow.

Mit der HoloLens ein Stück Berlin nach Köln holen
News
News

Mit der HoloLens ein Stück Berlin nach Köln holen

Im Rahmen eines zweitägigen Hackathons haben sich einige Mitarbeiter der novaCapta der Microsoft HoloLens und dem Thema Mixed Reality gewidmet. Dabei haben wir...

Azure Functions: Der Webservice ohne Webserver
Blog
Blog

Azure Functions: Der Webservice ohne Webserver

Azure Functions als Authentifizierungs-Helfer für clientseitige Lösungen mit 3rd Party APIs

Paket Dependency Manager für .NET
Blog
Blog

Paket Dependency Manager für .NET

Paket ist ein Dependency Manager für .NET, welcher es sich zum Ziel gesetzt hat einige Probleme von NuGet zu beheben.

Oct
12
PCDE #3 Event am 12.10. in Stuttgart
Event
Event

PCDE #3 Event am 12.10. in Stuttgart

Developer und IT-Professionals aufgepasst! Das novaCapta-Team nimmt am 12. Oktober am Pitch Club Developer Edition (PCDE) in Stuttgart teil. Dort stellen wir Ih...