SharePoint a rychle — Reese je arašídové máslo Poháry podnikových aplikací?

Já jsem skončil den 2 RYCHLÉ školení v slunné Needham, MA, a já jsem překypující nápady (Jaké všechny dobrý trénink třídy mi dělat). Jeden konkrétní aspekt rychle má mě přemýšlet a chtěl jsem to napsat, zatímco to bylo ještě čerstvé a běžné každodenní "věci" strčil ji honila hlavou.

Jsme SharePoint WSS 3.0 / MOSS realizátoři často čelí těžký problém se jakéhokoli projektu SharePoint přiměřeně velké: Jak dostaneme všechny netagované údaje načteny do SharePoint tak, aby to vše zapadá do našeho dokonale navržený informační architektury?

Dost často, to není tak těžké problém, protože jsme sami oboru z potíží: "Jsme jedno, o nic víc než 3 měsíců věku." "Zvládneme to staré věci s klíčové slovo vyhledávání a jít vpřed uděláme to správně…" Atd.

Ale, Co se stane, když jsme sami nemůžeme oboru z potíží a Hledíme na 10 tisíc nebo 100 tisíc (nebo dokonce miliony) docs — načítání a tagování je naše zbožné přání?

RYCHLÉ může být odpověď.

FAST je proces hledání zahrnuje mnoho pohyblivých částí, ale je jedno zjednodušené zobrazení:

  • Crawler proces vypadá pro obsah.
  • Vyhledá obsah a ruce pryč, aby makléř proces, který spravuje fond dokumentů procesorů.
  • Broker procesu to ruce pryč, aby jeden z procesorů dokumentu.
  • Procesor dokument analyzuje dokument a prostřednictvím potrubí procesu, analyzuje bejeezus z dokumentu a ruce pryč k procesu typ tvůrce indexu.

Na lodi rychle, Máme hodně kontroly nad potrubí zpracování dokumentů. Můžeme míchat a zápas o 100 komponenty příležitostí a, nejvíce zajímavé, můžeme napsat vlastní komponenty. Jak říkám, RYCHLE je analýza dokumentů, všemožně, ale neděle a sestavuje spoustu užitečných informací o těchto dokumentů. Ti blázni rychle jsou jasně šílený a obsedantní o dokumentu analýzy, protože mají nástroje a strategie opravdu kategorizace dokumentů.

Tak … použití v kombinaci s vlastní komponenty příležitostí, můžeme chytit všechny kontextové informace z rychle a krmit zpět na mech. To by mohlo jít něco podobného:

  • Dokument se přivádí do rychle z MECHU.
  • Normální blázen fanatika rychle dokument analýzu a kategorizaci se stane.
  • Naše vlastní komponenty příležitostí kapky některé z této kontextové informace z databáze.
  • Proces vlastní konstrukce přečte informace o kontextu, některé rozhoduje jak se vešel tento dokument MOSS v rámci naší IA a označí pomocí webové služby a objektový model.

Samozřejmě, žádný takový automatizovaný proces může být dokonalý, ale díky fanatika (a možná i insane-but-in-a-good-way rychle lidé), Máme skutečný bojový šanci na skutečně účinné hromadné zatížení proces, který víc než jen naplnit databázi SQL s partou sotva vyhledávání dokumentů.

</Konec>

Přihlásit se na mém blogu.

Doplněk Technorati značky: , ,

Zanech odpověď

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *