Einsatz von FirstSpirit Website Crawl bei der SharePoint Enterprise Suche

Die Einbindung von Inhaltsquellen in die SharePoint Enterprise Suche kann den Administrator vor unvorhersehbare Herausforderungen stellen. Die Indizierung eines Intranets sollte so im Standard über die Einbindung als Website eigentlich kein Problem darstellen. Funktioniert dies dann nicht, beginnt eine teils zeitintensive Fehler- und Lösungssuche. So erwartet SharePoint bei der initialen Verbindung zu einer zu indizierenden Webseite einen HTTP 200 Returncode.

Bei Indizierung eines Intranets auf Basis von FirstSpirit wird jedoch bei erstmaliger Verbindung ohne gesetztem Cookie erst ein HTTP 202 zurückgegeben. In der Dokumentation für Administratoren FirstSpirit™ 2018-07 steht hierzu der folgende Vermerk:

“Vor FirstSpirit-Version 5.2R2 wurde ACCEPTED (202) gesendet. Abhängig von der eingesetzten Infrastruktur wird dieser Status (202) nicht als „gültig“ akzeptiert, was beispielsweise zu Problemen bei der Indizierung führen kann (bekanntes Problem: SharePoint Crawler unter Windows). Das Standardverhalten wurde daher mit 5.2R2 umgestellt.”

Quelle: https://docs.e-spirit.com/odfs/dokumentation/administratore/ADMI_DE_FirstSpirit_Administrators.pdf

Das Verhalten ist über die IE Entwicklertools belegbar, die Webseite wird so von SharePoint nicht gecrawled, der Vorgang bricht ab.

Auch die Konfiguration einer Crawl-Regel unter Verwendung der Cookie Authentifizierung funktioniert nicht, hier ist ebenfalls der initiale Aufbau durch den fehlenden HTTP 200 nicht möglich.

Lösung ist hier das Schreiben eines kurzen PowerShell-Skriptes, welches über die Windows Server Aufgabenplanung, alternativ zur Regelplanung, regelmäßig gestartet werden kann.

Das Skript öffnet über einen Invoke-WebRequest zunächst die erste Seite des Intranets und liest den notwendigen Cookie JSESSIONID aus. Im Anschluss wird der Cookie der Suchkonfiguration näher der Crawl Regel hinzugefügt und der Crawl gestartet. Durch den gesetzten Cookie wird dann beim ersten Crawl-Zugriff der notwendige HTTP 200 zurückgegeben und die Webseite kann indiziert werden.

Erfahren Sie mehr

Office 365 Groups als Evolution von SharePoint?
Blog
Blog

Office 365 Groups als Evolution von SharePoint?

Zusätzlich zu SharePoint erlauben die Office 365 Groups es mir als Anwender, schnell und einfach neue Gruppen anzulegen und selbständig Benutzer hinzuzufügen.

Das neuste Mitglied der Office 365 Familie: Delve
Blog
Blog

Das neuste Mitglied der Office 365 Familie: Delve

Microsoft legt nach: Mit Delve startet eine neue Form des Suchens und des Auffinden von Dokumenten und Informationen.

Nov
07
Webcast mit Microsoft: Das Intranet zu Ende gedacht
Webinar
Webinar

Webcast mit Microsoft: Das Intranet zu Ende gedacht

Am 07. November findet erneut eines unserer Webinare gemeinsam mit Mircosoft statt. Das Thema dieses Mal: Das Intranet zu Ende gedacht – Die Informationszentral...

Auf Goldkurs in der Cloud
News
News

Auf Goldkurs in der Cloud

Die novaCapta hat ihren Partnerstatus bei Microsoft zusätzlich vergoldet: Auch in der Sparte Cloud Productivity haben wir jetzt den Goldstatus.

Valo ist neuer Partner der novaCapta für Intranets
News
News

Valo ist neuer Partner der novaCapta für Intranets

Durch die Partnerschaft mit Valo, dem Ready-2-Go Intranet-Baukasten aus Finnland baut die novaCapta ihr Angebot bei der Umsetzung von schnellen und funktionalen...

novaCapta auf der Fachtagung für Interne Revision
Event
Event

novaCapta auf der Fachtagung für Interne Revision

Das Expertenteam der novaCapta präsentiert am 15. und 16. November ihre innovative Audit Management Lösung auf dem DIIR-Kongress in Dresden. Besuchen Sie unsere...

Mit der HoloLens ein Stück Berlin nach Köln holen
News
News

Mit der HoloLens ein Stück Berlin nach Köln holen

Im Rahmen eines zweitägigen Hackathons haben sich einige Mitarbeiter der novaCapta der Microsoft HoloLens und dem Thema Mixed Reality gewidmet. Dabei haben wir...

Oct
12
PCDE #3 Event am 12.10. in Stuttgart
Event
Event

PCDE #3 Event am 12.10. in Stuttgart

Developer und IT-Professionals aufgepasst! Das novaCapta-Team nimmt am 12. Oktober am Pitch Club Developer Edition (PCDE) in Stuttgart teil. Dort stellen wir Ih...

May
04
novaCapta auf der dotnet Cologne
Event
Event

novaCapta auf der dotnet Cologne

In nächster Nachbarschaft zu unserem Kölner Büro findet am 04. und 05. Mai die dotnet Cologne im KOMED statt. Wir von der novaCapta sind auch dabei.

Theobald Software neuer Partner von novaCapta
News
News

Theobald Software neuer Partner von novaCapta

Komplexe SAP-Prozesse direkt in SharePoint durchführen – dabei unterstützt uns unser neuer Partner Theobald Software.

Jan
25
Webcast mit Microsoft: Fit für die digitale Arbeitswelt
Webinar
Webinar

Webcast mit Microsoft: Fit für die digitale Arbeitswelt

Die digitale Transformation und die Veränderung der Arbeitswelt ist längst in vielen Unternehmen und in den öffentlichen Einrichtungen angekommen. Dennoch stell...

novaCapta ist Sitecore Implementierungspartner
News
News

novaCapta ist Sitecore Implementierungspartner

Sitecore ist die führende.NET Enterprise Content- und Customer Experience Management-Plattform für ihr strategisches Online-Marketing. novaCapta hat sich als Si...