СхареПоинт и ФАСТ — Рис је у Пеанут Буттер Цупс оф Ентерприсе Аппс?

Завршио сам се дан 2 брзе обуке у сунчаном Неедхам, МА, и ја сам препун идеја (што све добре часове обуке да ми уради). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" гурнуо га из моје главе.

Ми СхареПоинт ВСС 3.0 / МОСС реализатори често суочавају тежак проблем са било разумно величине СхареПоинт пројекта: Како да добијете све податке унете у УНТАГГЕД СхареПоинт такав да се све то уклапа у наше савршено дизајниран информационе архитектуре?

Често довољно, ово није тежак проблем, јер смо се обим из невоље: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.

Али, what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (или чак милиона) за документе — учитавање и означавање што је наша жеља побожан?

ФАСТ може бити одговор.

Брз за претрагу процес укључује много покретних делова, али један поједностављен поглед је ово:

  • Гусеничар процес изгледа за садржај.
  • Она проналази садржај и предао га на брокера који управља процесом труст докумената процесора.
  • Брокер процес је руке са једном од докумената процесора.
  • Документ процесор анализира документ и путем гасовода процеса, анализира бејеезус из документа и предао га на индекс процес градитељ типа.

На броду ФАСТ, we have a lot of control over the document processing pipeline. We can mix and match about 100 Компоненте цевовода и, најинтересантније, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.

Тако … Коришћење брзих у комбинацији са нашим прилагођеним компонентама цевовода, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:

  • Документ је хранио у ФАСТ у Мосс.
  • Нормално луд опсесивно-ФАСТ документ анализи и категоризација се дешава.
  • Наше сопствене прилагођене гасовод компонента капи неке ван тог контекста информација у базу података.
  • Процес наше сопствене конструкције чита текстуалне информације, доноси неке одлуке о томе како да се уклопи у тај документ МОСС нашој ИА и обележава га користите веб сервиса и објектни модел.

Наравно, таква аутоматизован процес може бити савршен, али захваљујући опсесивно (и евентуално луда-али-у-добар-пут брзо људи), да имамо ратовали ударац по заиста ефикасан процес масовне оптерећења које чини више него само попуните СКЛ базу података са гомилом једва-претраживати докумената.

</крај>

Претплатите се на мој блог.

Леаве а Репли

Ваша емаил адреса неће бити објављена. Обавезна поља су означена *