ஷேர்பாயிண்ட் மற்றும் விரைவானது — நிறுவன Apps இன் ரீஸ் வேர்க்கடலை வெண்ணெய் கோப்பைகளையும்?

நான் நாள் வரை முடிச்சுட்டேன் 2 சன்னி நீதம் வேகமாக பயிற்சி, எம்.ஏ., நான் கருத்துக்களை வெடிக்கிறது (அனைத்து நல்ல பயிற்சி வகுப்புகள் எனக்கு செய்ய இது). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" என் தலை அதை தள்ளி.

நாம் ஷேர்பாயிண்ட் WSS 3.0 / பாசி செயல்படுத்துநர்களை அடிக்கடி எந்த நியாயமான அளவு ஷேர்பாயிண்ட் திட்டத்தின் ஒரு கடினமான பிரச்சினை: நாம் நமது செய்தபின் வடிவமைக்கப்பட்டுள்ளது தகவல் கட்டமைப்பு உள்ள பொருந்துகிறது என்று ஷேர்பாயிண்ட் ஏற்றப்பட்டன அனைத்து untagged தரவு எப்படி கிடைக்கும்?

பெரும்பாலும் போதும், இது ஒரு கடினமான பிரச்சினை அல்ல, ஏனெனில் பிரச்சனையில் நாம் நோக்கம் நம்மை வெளியே: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.

ஆனாலும், what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (அல்லது மில்லியன் கணக்கான) டாக்ஸ் — ஏற்றுதல் மற்றும் இது டேக்கிங் எங்கள் ஆர்வமுள்ள விருப்பம்?

விரைவானது பதில் இருக்கும்.

விரைவானது தேடல் செயல்முறை நகரும் பாகங்கள் நிறைய உள்ளன ஆனால் ஒரு எளிய பார்வை இந்த:

  • ஒரு கிராலர் செயல்முறை உள்ளடக்கம் தெரிகிறது.
  • அதை உள்ளடக்கத்தை கண்டுபிடித்து ஆவணம் செயலிகள் ஒரு பூல் நிர்வகிக்கும் ஒரு தரகர் செயல்முறை அதை கையில்.
  • தரகர் செயல்முறை ஆவணம் செயலிகள் ஒன்று அதை கையில்.
  • ஆவணம் செயலி ஆவணம் ஆய்வு மற்றும் ஒரு குழாய் செயல்முறை வழியாக, ஆவணம் வெளியே bejeezus ஆய்வு மற்றும் ஒரு குறியீட்டு கட்டடம் வகை செயலாக்கத்தை அதை கையில்.

ஸ்டார்ஷிப் வேகமாக, we have a lot of control over the document processing pipeline. We can mix and match about 100 குழாய் கூறுகள் மற்றும், மிகவும் சுவாரஸ்யமாக, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.

அப்படி … எங்கள் சொந்த விருப்ப குழாய் கூறு இணைந்து விரைவானது பயன்படுத்தி, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:

  • ஆவண பாசி இருந்து விரைவானது செலுத்தப்படுகிறது.
  • சாதாரண பைத்தியம்-துன்புறு விரைவானது ஆவணம் பாகுபடுத்தி மற்றும் வகைப்படுத்தல் நடக்கிறது.
  • எங்கள் சொந்த விருப்ப குழாய் கூறு ஒரு டேட்டாபேஸ் என்று சூழல் தகவலை சில குறைகிறது.
  • எங்கள் சொந்த வடிவமைப்பு ஒரு செயல்முறை சூழலில் தகவல் கூறுகிறது, எங்கள் IA உள்ள அந்த பாசி ஆவணம் பொருந்தும் எப்படி சில முடிவுகளை செய்கிறது மற்றும் ஒரு இணைய சேவை மற்றும் பொருள் மாதிரி பயன்படுத்தி அது குறிக்கிறது.

நிச்சயமாக, அத்தகைய தானியங்கி செயல்பாடு துன்புறு சரியான ஆனால் நன்றி முடியும் (ஒருவேளை பைத்தியக்கார-ஆனால்-ல் ஒரு நல்ல வழி விரைவானது மக்கள்), வெறும் அரிதாகவே-தேட ஆவணங்களை ஒரு கொத்து ஒரு SQL தரவுத்தள நிரப்ப விட நாம் என்று ஒரு உண்மையான பயனுள்ள வெகுஜன சுமை செயல்முறை படமாக்கப்பட்டன ஒரு உண்மையான போர் இருக்கலாம்.

</இறுதியில்>

என்னுடைய குழுசேர்.

ஒரு பதில் விட்டு

உங்கள் மின்னஞ்சல் முகவரி வெளியிடப்பட்ட முடியாது. தேவையான புலங்கள் குறிக்கப்பட்டன *