SharePoint och snabbt — Reese's Peanut Butter Cups av Enterprise Apps?

Jag har avslutat dagen 2 SNABB utbildning i soliga Needham, MA, och sprack med idéer (som alla bra utbildning klasser göra mig). En särskild aspekt av har snabbt mig att tänka och jag ville skriva ner det medan det var fortfarande fräsch och normala dagliga "saker" sköt det ur huvudet.

Vi SharePoint WSS 3.0 / MOSS genomförare möta ofta en tuff problem med någon rimligen medelstora SharePoint-projekt: Hur får vi alla otaggade data laddas in i SharePoint så att allt passar i våra perfekt designade informationsarkitektur?

Ofta nog, Detta är inte ett svårt problem eftersom vi omfattning oss trubbel: "Vi bryr oss inte om något mer än 3 månader gammal." "Vi ska hantera allt det gamla grejer med sökning på nyckelord och gå framåt vi gör det på rätt sätt…" Etc.

Men, Vad händer om vi inte kan verksamhetsområde oss borta från problem och vi tittar på 10-talet tusentals eller 100-tals tusentals (eller ens miljoner) för docs — lastning och märkning som är vår fromma önskan?

SNABBT kan vara svaret.

FAST: s sökprocessen innehåller en hel del rörliga delar men en förenklad vy är detta:

  • En sökrobot process ser ut för innehåll.
  • Det finner innehåll och överlämnar det bort till en mäklare process som hanterar en pool av dokument-processorer.
  • Mäklare processen räcker det bort till en av de dokument-processorerna.
  • Dokumentet processorn analyserar dokumentet och via en pipeline process, analyserar bejeezus av dokumentet och överlämnar det bort till en index builder typ process.

På rymdskeppet snabbt, Vi har en hel del kontroll över dokumentet bearbetning pipeline. Vi kan mixa och matcha om 100 komponenter för försäljningsförloppet och, mest intressant, Vi kan skriva våra egna komponenter. Som jag säger, FAST är att analysera dokument every vilket sätt men söndag och det sammanställer en hel del användbar information om dessa handlingar. De galna snabba människorna är helt klart galen och tvångstankar om dokumentanalys eftersom de har verktyg och/eller strategier för att riktigt kategorisera dokument.

Så … med snabbt i kombination med våra egna anpassade försäljningsförloppskomponenten, Vi kan ta tag i den sammanhanget informationen från FAST och mata den tillbaka till MOSS. Det kan gå något sådant:

  • Dokument matas in snabbt från MOSS.
  • Normala crazy-tvångsmässiga snabbt dokument parsning och kategorisering händer.
  • Våra egna anpassade försäljningsförloppskomponenten droppar några av sammanhang informationen ut till en databas.
  • En process av egen design läser sammanhangsinformation, gör några beslut på hur passar MOSS dokumentet inom våra IA och markerar det med en webbtjänst och objektmodellen.

Självklart, ingen sådan automatiserad process kan vara perfekt men tack vare tvångsmässiga (och möjligen insane-but-in-a-good-way snabb människor), Vi kan ha en riktig kämpar skott på en verkligt effektiva massa belastning process som mer än bara fyller upp en SQL-databas med en massa knappt sökbara dokument.

</slutet>

Prenumerera på min blogg.

Technorati Tags: , ,

Lämna svar

Din e-postadress kommer inte att publiceras. behövliga fält är markerade *