શ્રેણી આર્કાઇવ્ઝ: SharePoint શોધ

શેવાળમાં સમાનાર્થક શબ્દોનો કોશ ગોઠવો

હું આ અઠવાડિયે એક સ્થાપત્ય સમીક્ષા દસ્તાવેજ પર કામ કરું છું અને તે સૂચવે છે, અન્ય વસ્તુઓ વચ્ચે, that the client consider using the thesaurus to help improve the end user search experience. Having never done this myself, I wanted to do a quick hands-on test so that my suggestion is authentic.

તે કેવી રીતે કરવું તે બહાર આકૃતિ આશ્ચર્યજનક મુશ્કેલ હતો, તે છે, તેમ છતાં, હકીકતમાં, quite easy. There’s a pretty good bit of information on the thesaurus (તપાસ અહીં અને અહીં, ઉદાહરણ માટે). તેમ છતાં, તે દસ્તાવેજોને WSS ક્યાં છે 2.0 / એસપીએસ 2003 oriented or they don’t actually spell out what do to after you’ve made your changes in the thesaurus. They provide a great overview and fair bit of detail, પરંતુ તે અંતિમ રેખા પાર કરવા માટે પૂરતી નથી.

આ પગલાંઓ મારા માટે કામ કર્યું:

  1. Make the changes to the thesaurus. (એક મહત્વની નોંધ માટે નીચે જુઓ)
  2. Go to the server and restart the "Office SharePoint Server Search" સેવા.

માટે ટોપી એક ટિપ મિસ્ટર. જોહાન. ડી. ધીમે ધીમે અથવા મુશ્કેલીથી પસાર થવું (જીવ અર્થને સમાસિત કરતો ઉપસર્ગ). He provided the key bit about restarting the search service and rescued me from endless, time consuming and unnecessary iisresets and full index crawls. This episode સાબિત, ફરી એક વાર, કે પક્ષીએ is the awesome. (અહીં Twitter પર અનુસરો મને. I follow any SharePoint person that follows me).

I don’t know if this functionality is available in WSS. If it is or is not, એક ટિપ્પણી મૂકો અથવા મને ઇમેઇલ કરો અને હું આ પોસ્ટને અપડેટ કરીશું.

મહત્વની નોંધ: There’s conflicting information on which XML thesaurus file to change. There’s this notion of "tsneu.xml" as being the "neutral" સમાનાર્થક શબ્દોનો કોશ. I wasted some time working with that one. મારા કિસ્સામાં, I needed to change the "tsenu.xml" ફાઇલ એપ્લિકેશન ID ને પોતે ફોલ્ડર હેઠળ સ્થિત થયેલ: \\win2003srv C $ કાર્યક્રમ ફાઈલો માઈક્રોસોફ્ટ ઓફિસ સર્વરો 12.0 ડેટા ઓફિસ સર્વર કાર્યક્રમો 3c4d509a-75c5-481c-8bfd-099a89554e17\Config. I assume that in a multi-farm situation, તમને આ ફેરફાર બધે એક ક્વેરી સર્વર સ્કોર બનાવશે.

</અંત>

મારા બ્લોગ પર સબ્સ્ક્રાઇબ કરો.

શેરપોઈન્ટ અને ઝડપી — Enterprise Apps ની રીસ માતાનો મગફળીના માખણ કપ?

હું દિવસ સુધી સમાપ્ત કર્યું 2 સન્ની નિધાન ઝડપી તાલીમ, MA, અને હું વિચારો સાથે છલકાતું છું (બધા સારા તાલીમ વર્ગો મારા માટે શું કરવું જે). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" મારા માથા બહાર નહીં.

અમે શેરપોઈન્ટ WSS 3.0 / MOSS implementers વારંવાર કોઈપણ કારણભૂત માપવાળા શેરપોઈન્ટ પ્રોજેક્ટ સાથે ખડતલ સમસ્યા સામનો: અમે તેને અમારા બધા સંપૂર્ણપણે ડિઝાઇન માહિતી આર્કીટેક્ચર અંદર બંધબેસે છે કે શેરપોઈન્ટ માં લોડ તમામ untagged માહિતી કેવી રીતે મેળવી શકું?

ઘણી વાર પૂરતી, આ જેમ કે હાર્ડ સમસ્યા નથી કારણ કે મુશ્કેલી અમે સ્કોપ જાતને બહાર: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.

પરંતુ, what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (અથવા પણ લાખો) ડૉક્સ — લોડ અને જે ટેગિંગ અમારા હાર્દિક ઇચ્છા છે?

ફાસ્ટ જવાબ હોઇ શકે છે.

ઝડપી શોધ પ્રક્રિયા મૂવિંગ પાર્ટ્સ ઘણો સમાવેશ થાય છે પરંતુ એક સરળ દૃશ્ય આ છે:

  • એક ક્રાઉલર પ્રક્રિયા સામગ્રી માટે જુએ છે.
  • તે સામગ્રી શોધે અને દસ્તાવેજ પ્રોસેસર્સ એક પૂલ વ્યવસ્થા કે બ્રોકર પ્રક્રિયા કરવા માટે તેને બંધ હાથ.
  • બ્રોકર પ્રક્રિયા દસ્તાવેજ પ્રોસેસર્સ એક રન નોંધાયો હાથ.
  • આ દસ્તાવેજ પ્રોસેસર દસ્તાવેજ વિશ્લેષણ કરે છે અને પાઇપલાઇન પ્રક્રિયા મારફતે, આ દસ્તાવેજ બહાર bejeezus વિશ્લેષણ કરે છે અને ઇન્ડેક્સ બિલ્ડર પ્રકાર પ્રક્રિયા કરવા માટે તેને બંધ હાથ.

જો starship ફાસ્ટ પર, we have a lot of control over the document processing pipeline. We can mix and match about 100 પાઇપલાઇન ઘટકો અને, સૌથી રસપ્રદ, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.

તેથી … અમારા પોતાના વૈવિધ્યપૂર્ણ પાઇપલાઇન ઘટક સાથે ઝડપી મદદથી, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:

  • દસ્તાવેજ MOSS ફાસ્ટ માં આપવામાં આવે છે.
  • સામાન્ય ક્રેઝી-બાધ્યતા ફાસ્ટ દસ્તાવેજ પદચ્છેદન અને વર્ગીકરણ થાય છે.
  • અમારા પોતાના વૈવિધ્યપૂર્ણ પાઇપલાઇન ઘટક એક ડેટાબેઝ છે કે સંદર્ભ માહિતી કેટલાક બંધ ડ્રોપ્સ.
  • આપણા પોતાના ડિઝાઇન પ્રક્રિયા સંદર્ભમાં માહિતી વાંચો, અમારા IA અંદર કે MOSS દસ્તાવેજ ફિટ કેવી રીતે કેટલાક નિર્ણયો કરે છે અને એક વેબ સેવા અને ઓબ્જેક્ટ મોડલ ઉપયોગ કરીને તે ચિહ્નિત કરે છે.

અલબત્ત, આવી કોઈ ઓટોમેટેડ પ્રક્રિયા બાધ્યતા માટે સંપૂર્ણ પરંતુ આભાર હોઈ શકે છે (અને કદાચ પાગલ-પરંતુ ઈન એ સારી રીતે ફાસ્ટ લોકો), માત્ર ભાગ્યે-શોધી દસ્તાવેજો એક ટોળું સાથે SQL ડેટાબેઝ ભરો કરતાં અમે વધુ કરે છે કે ખરેખર અસરકારક સામૂહિક લોડ પ્રક્રિયા પર ગોળી એક વાસ્તવિક લડાઇ પણ હોઈ શકે છે.

</અંત>

મારા બ્લોગ પર સબ્સ્ક્રાઇબ કરો.

Technorati ટૅગ્સ: , ,

કોઈ વધુ પાસાદાર શોધ ફેંસ સિટ્ટર

હું સાથે વિશે રમવા આજે કારણ હતું કોડપ્લેક્સ પાસાદાર શોધ project today.

તે જ્યારે માટે આસપાસ કરવામાં આવી છે, પરંતુ હું સામાન્ય કારણો માટે તેને ડાઉનલોડ અને વાપરવા માટે ખચકાયા (સમય મુખ્યત્વે અભાવ), plus outright fear 🙂

તમે તમારા શોધ સુધારવા અને નવા વિકલ્પો અન્વેષણ કરવા માટે શોધી રહ્યાં છો, તો, download it and install it when you have an hour or so of free time. I followed the installation manual’s instructions and it took me less than 20 minutes to have it installed and working. It provides value minute zero.

It does look pretty hard to extend. The authors provide a detailed walk-through for a complex BDC scenario. I may be missing it, but I wish they would also provide a simpler scenario involving one of the pre-existing properties or maybe adding one new managed property. I shall try and write that up myself in the next period of time.

નીચે લીટી — મિનિટ, તમે સ્થાપિત કરી શકો છો, તે રૂપરેખાંકિત, use it and add some pretty cool functionality to your vanilla MOSS search and be a hero 🙂

</અંત>

મારા બ્લોગ પર સબ્સ્ક્રાઇબ કરો.

Technorati ટૅગ્સ:

શેરપોઈન્ટ વાઇલ્ડકાર્ડ શોધ: “સમાસમાં પૂર્વે ને માટેનો અર્થ સૂચવનારો ઉપસર્ગ” એક સ્ટેમ નથી “પ્રોગ્રામિંગ”

જો એમએસડીએન શોધ ફોરમ પર, લોકો ઘણી વાર આ જેમ એક પ્રશ્ન પૂછો:

"I have a document named ‘Programming Guide’ but when I search for ‘Pro’ શોધ તેને શોધી નથી."

તે જેવી લાગે શકે નહિં, but that amounts to a wildcard search. The MOSS/WSS user interface does not support wildcard search out of the box.

If you dig into the search web parts, you’ll find a checkbox, "Enable search term stemming". Stemming is a human-language term. It’s not a computer language substring() type function.

These are some stems:

  • "fish" is a stem to "fishing"
  • "major" is a stem to "majoring"

These are not stems:

  • "maj" is not a stem to "major"
  • "pro" is not a stem to "programmer"

The WSS/MOSS search engine does support wild card search through the API. Here is one blog article that describes how to do that: http://www.dotnetmafia.com/blogs/dotnettipoftheday/archive/2008/03/06/how-to-use-the-moss-enterprise-search-fulltextsqlquery-class.aspx

A 3rd party product, Ontolica, provides wild card search. I have not used that product.

</અંત>

મારા બ્લોગ પર સબ્સ્ક્રાઇબ કરો.

Technorati ટૅગ્સ: