SharePoint e FAST — Tazze di burro di arachidi di Reese di applicazioni aziendali?

Ho finito il giorno 2 di formazione veloce nella soleggiata Needham, MA, e sono traboccanti di idee (fare a me, che tutte le classi di buona formazione). Un aspetto particolare della veloce mi ha pensare e volevo scriverlo mentre era ancora fresco e normale giorno per giorno "roba" spinto dalla mia testa.

Abbiamo SharePoint WSS 3.0 / Gli implementatori MOSS spesso affrontano un problema difficile con qualsiasi progetto SharePoint di dimensioni ragionevoli: Come possiamo ottenere tutti i dati senza tag caricati in SharePoint, tale che tutto si inserisce all'interno della nostra architettura informazioni perfettamente progettato?

Abbastanza spesso, Questo non è un problema difficile, perché noi stessi abbiamo portata fuori dai guai: "Non ci interessa di niente più di 3 mesi di età." "Ci occuperemo di tutto ciò che cose con ricerca per parola chiave e andare avanti lo faremo nel modo giusto…" Ecc.

Ma, cosa succede se siamo noi stessi non possiamo definire l'ambito fuori dai guai e stiamo guardando decine di migliaia o centinaia di migliaia (o addirittura milioni) di documenti — il caricamento e tagging di cui è nostro desiderio devoto?

VELOCE potrebbe essere la risposta.

Processo di ricerca di FAST include un sacco di parti in movimento, ma questo è una visione semplificata:

  • Un processo di cingolo cerca contenuto.
  • Trova il contenuto e le mani fuori a un processo di broker che gestisce un pool di processori di documento.
  • Processo di broker si passa a uno dei processori documento.
  • Il processore del documento analizza il documento e tramite un processo di pipeline, analizza il bejeezus fuori il documento e le mani fuori da un processo di tipo generatore di indice.

Sulla nave veloce, Abbiamo un sacco di controllo sulla pipeline di elaborazione dei documenti. Siamo in grado di mescolare e abbinare su 100 componenti della pipeline e, più interessante, possiamo scrivere i nostri propri componenti. Come ho detto, FAST è analizzando i documenti ogni modo ma domenica e compila un sacco di informazioni utili su tali documenti. Quei pazzi veloce sono chiaramente pazzo e ossessivo di analisi dei documenti perché hanno strumenti e/o strategie per davvero categorizzare i documenti.

Così … utilizzo veloce in combinazione con il nostro componente personalizzato, Siamo in grado di afferrare tutte le che informazioni di contesto da FAST e alimentarlo torna a MOSS. Potrebbe andare qualcosa di simile:

  • Documento è alimentato in fretta da MOSS.
  • Normale documento veloce pazzo-ossessivo, l'analisi e la classificazione avviene.
  • Nostro componente personalizzato scende alcune di tali informazioni di contesto fuori a un database.
  • Un processo del nostro design legge le informazioni di contesto, rende alcune decisioni su come adattare quel documento muschio all'interno del nostro IA e segna utilizzando un servizio web e il modello di oggetto.

Naturalmente, nessun processo automatizzato può essere perfetta ma grazie ossessivo (e forse insane-but-in-a-good-way persone veloce), possiamo avere un vero e proprio colpo a un processo di caricamento di massa veramente efficace che riempiono più appena di un database SQL con un mucchio di documenti ricercabili a malapena di combattimento.

</fine>

Iscriviti al mio blog.

Lasciare una risposta

L'indirizzo email non verrà pubblicato. i campi richiesti sono contrassegnati *