بایگانی دسته بندی: شیرپوینت جستجو

Configure Thesaurus in MOSS

I’m working on an architecture review document this week and it suggests, در میان چیزهای دیگر, that the client consider using the thesaurus to help improve the end user search experience. Having never done this myself, I wanted to do a quick hands-on test so that my suggestion is authentic.

It was surprisingly difficult to figure out how to do, although it is, در واقع, quite easy. There’s a pretty good bit of information on the thesaurus (check اینجا و اینجا, مثلا). اما, those docs are either WSS 2.0 / SPS 2003 oriented or they don’t actually spell out what do to after you’ve made your changes in the thesaurus. They provide a great overview and fair bit of detail, but it’s not enough to cross the finishing line.

These steps worked for me:

  1. Make the changes to the thesaurus. (See below for an important note)
  2. Go to the server and restart the "Office SharePoint Server Search" service.

A tip of the hat to Mr. J. D. Wade (bio). He provided the key bit about restarting the search service and rescued me from endless, time consuming and unnecessary iisresets and full index crawls. This episode proves, once again, that Twitter is the awesome. (Follow me on twitter here. I follow any SharePoint person that follows me).

I don’t know if this functionality is available in WSS. If it is or is not, please leave a comment or email me and I’ll update this post.

Important note: There’s conflicting information on which XML thesaurus file to change. There’s this notion of "tsneu.xml" as being the "neutral" thesaurus. I wasted some time working with that one. در مورد من, I needed to change the "tsenu.xml" file located under the folder of the app ID itself: \\win2003srv\c$\Program Files\Microsoft Office Servers\12.0\Data\Office Server\Applications\3c4d509a-75c5-481c-8bfd-099a89554e17\Config. I assume that in a multi-farm situation, you would make this change everywhere a query server runs.

</پایان>

مشترک شدن در وبلاگ من.

برچسب ها: , ,

شیرپوینت و FAST — لیوان کره بادام زمینی ریس نرم افزار سازمانی?

من به پایان رسید تا روز 2 آموزش FAST در آفتابی Needham, MA, و من سرشار از ایده (که تمام کلاس های آموزش خوب به من). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" تحت فشار قرار دادند آن را از سر من.

ما شیرپوینت WSS 3.0 / در مجریان MOSS اغلب مشکل سخت با هر پروژه شیرپوینت اندازه منطقی با آن مواجه است: چگونه می توانم تمام اطلاعات untagged لود شده به شیرپوینت به طوری که آن را همه در درون کاملا طراحی معماری اطلاعات ما متناسب با ما?

اغلب به اندازه کافی, این چنین یک مشکل سخت نیست چون ما خودمان را دامنه از مشکلات: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.

اما, what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (یا حتی میلیون ها) اسناد — در حال بارگذاری و برچسب زدن که آرزوی مؤمن ما است?

FAST ممکن است پاسخ.

فرایند جستجو FAST شامل بسیاری از قطعات در حال حرکت است، اما یک مشاهده ساده این است:

  • روند خزنده به نظر می رسد برای محتوای.
  • آن را پیدا کرد و آن دست کردن به یک روند کارگزار است که مدیریت یک استخر پردازنده های سند.
  • فرایند کارگزار آن دست کردن به یکی از پردازنده های سند.
  • پردازنده سند تجزیه و تحلیل سند و از طریق یک فرایند خط لوله, تجزیه و تحلیل bejeezus سند و آن دست کردن به یک ایندکس از نوع روند سازنده.

FAST کشتی فضایی, we have a lot of control over the document processing pipeline. We can mix and match about 100 اجزای خط لوله و, جالب, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.

پس … با استفاده از FAST در ترکیب با خود جزء خط لوله سفارشی ما, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:

  • سند به FAST از MOSS تغذیه.
  • عادی دیوانه وسواسی تجزیه سند FAST و طبقه بندی اتفاق می افتد.
  • خود را جزء خط لوله سفارشی ما قطره برخی از این اطلاعات زمینه را به پایگاه داده.
  • فرایند طراحی خود ما اطلاعات متن را می خواند, باعث می شود برخی از تصمیم گیری در مورد چگونگی جا که سند خزه در داخل IA ما و نشانگر آن را با استفاده از یک وب سرویس و مدل شی.

البته, چنین فرآیند خودکار می تواند کامل باشد اما به لطف به وسواس (و مردم FAST احتمالا دیوانه اما در یک خوب راه), ما ممکن است یک جنگ واقعی عالی در یک فرآیند بار جرم واقعا موثر است که می کند بیشتر از فقط پر کردن یک پایگاه داده SQL با یک دسته از اسناد به سختی قابل جستجو.

</پایان>

مشترک شدن در وبلاگ من.

جست و جو مراقب نرده هیچ وجهی بیشتر

I had reason today to play about with the codeplex faceted search project today.

آن را در اطراف برای مدتی بوده است, اما من تردید برای دانلود و استفاده از آن به دلایل معمول (عمدتا کمبود وقت), به علاوه ترس آشکار 🙂

اگر شما به دنبال برای بهبود جستجو خود و کشف گزینه های جدید, download it and install it when you have an hour or so of free time. I followed the installation manual’s instructions and it took me less than 20 minutes to have it installed and working. It provides value minute zero.

It does look pretty hard to extend. The authors provide a detailed walk-through for a complex BDC scenario. I may be missing it, but I wish they would also provide a simpler scenario involving one of the pre-existing properties or maybe adding one new managed property. I shall try and write that up myself in the next period of time.

خط پایین — in minutes, you can install, configure it, استفاده از آن و اضافه کردن برخی از قابلیت های بسیار سرد به جستجو MOSS وانیل شما و یک قهرمان 🙂

</پایان>

مشترک شدن در وبلاگ من.

جستجو در شیرپوینت کلمات: “نرم افزار” بنیادی است. “برنامه نویسی”

در MSDN جستجو در انجمن, مردم اغلب سوال شبیه به این را بپرسید:

"I have a document named ‘Programming Guide’ but when I search for ‘Pro’ جستجو آن را پیدا می کند نیست."

این نه ممکن است احساس آن را دوست دارم, but that amounts to a wildcard search. The MOSS/WSS user interface does not support wildcard search out of the box.

اگر شما را به بخش های جستجوی وب حفاری, شما یک چک باکس, "Enable search term stemming". Stemming is a human-language term. It’s not a computer language substring() تابع نوع.

اینها برخی از ساقه:

  • "fish" is a stem to "fishing"
  • "major" is a stem to "majoring"

این ناشی نمی:

  • "maj" is not a stem to "major"
  • "pro" is not a stem to "programmer"

The WSS/MOSS search engine does support wild card search through the API. Here is one blog article that describes how to do that: http://www.dotnetmafia.com/blogs/dotnettipoftheday/archive/2008/03/06/how-to-use-the-moss-enterprise-search-fulltextsqlquery-class.aspx

A 3rd party product, Ontolica, provides wild card search. I have not used that product.

</پایان>

مشترک شدن در وبلاگ من.

برچسب ها: