კატეგორია არქივი: SharePoint ძიება

კონფიგურაცია Thesaurus in MOSS

მე მომუშავე არქიტექტურის განხილვის დოკუმენტში ამ კვირაში და ეს ვარაუდობს, სხვა საკითხებთან, that the client consider using the thesaurus to help improve the end user search experience. Having never done this myself, I wanted to do a quick hands-on test so that my suggestion is authentic.

It was surprisingly difficult to figure out how to do, although it is, სინამდვილეში, quite easy. There’s a pretty good bit of information on the thesaurus (check აქ და აქ, მაგალითად). თუმცა, those docs are either WSS 2.0 / SPS 2003 oriented or they don’t actually spell out what do to after you’ve made your changes in the thesaurus. They provide a great overview and fair bit of detail, but it’s not enough to cross the finishing line.

These steps worked for me:

  1. Make the changes to the thesaurus. (See below for an important note)
  2. Go to the server and restart the "Office SharePoint Server Search" service.

A tip of the hat to Mr. J. D. Wade (bio). He provided the key bit about restarting the search service and rescued me from endless, time consuming and unnecessary iisresets and full index crawls. This episode proves, კიდევ ერთხელ, that Twitter is the awesome. (Follow me on twitter here. I follow any SharePoint person that follows me).

I don’t know if this functionality is available in WSS. If it is or is not, please leave a comment or email me and I’ll update this post.

მნიშვნელოვანი შენიშვნა: There’s conflicting information on which XML thesaurus file to change. There’s this notion of "tsneu.xml" as being the "neutral" თეზაურუსის. I wasted some time working with that one. ჩემს შემთხვევაში, I needed to change the "tsenu.xml" file located under the folder of the app ID itself: \\win2003srv\c$\Program Files\Microsoft Office Servers\12.0\Data\Office Server\Applications\3c4d509a-75c5-481c-8bfd-099a89554e17\Config. I assume that in a multi-farm situation, you would make this change everywhere a query server runs.

</ბოლო>

გამოწერა ჩემი დღიური.

პროგრამები Tags: , ,

SharePoint და სწრაფი — Reese-ის Peanut კარაქი თასი საწარმოთა პროგრამები?

მე დავამთავრე up დღეში 2 სწრაფი ტრენინგი მზიანი Needham, სამაგისტრო, და მე bursting ერთად იდეები (რომელშიც ყველა კარგი სასწავლო კლასების გაკეთება ჩემთვის). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" მივიღებთ ის ჩემი უფროსი.

ჩვენ SharePoint WSS 3.0 / MOSS განმახორციელებელი ხშირად წინაშე მკაცრი პრობლემა ნებისმიერი გონივრულად ზომის SharePoint პროექტი: როგორ უნდა მიიღონ ყველა untagged მონაცემები ჩაიტვირთება SharePoint ისეთი, რომ ეს ყველაფერი ჯდება ჩვენს კარგად შემუშავებული ინფორმაციის არქიტექტურის?

საკმაოდ ხშირად, ეს არ არის ისეთი რთული პრობლემა, რადგან ჩვენ ფარგლებს საკუთარ თავს out of trouble: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.

მაგრამ, what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (ან თუნდაც მილიონობით) საქართველოს Docs — დატვირთვა და ჭდეებისთვის რომლის ჩვენი devout სურვილი?

სწრაფი შეიძლება იყოს პასუხი.

სწრაფი ის საძიებო პროცესი მოიცავს უამრავ მოძრავი ნაწილები, მაგრამ ერთი გამარტივებული შეხედულება ამ:

  • Crawler პროცესი ეძებს შინაარსი.
  • იგი მიიჩნევს, შინაარსი და ხელში off to საბროკერო პროცესი, რომელიც მართავს აუზი დოკუმენტი პროცესორები.
  • საბროკერო პროცესი ხელში off ერთ დოკუმენტში პროცესორები.
  • დოკუმენტის პროცესორი აანალიზებს დოკუმენტი და მეშვეობით მილსადენის პროცესი, აანალიზებს bejeezus გარეთ დოკუმენტი და ხელში off to ინდექსი მშენებელი ტიპის პროცესი.

On starship FAST, we have a lot of control over the document processing pipeline. We can mix and match about 100 მილსადენის კომპონენტები და, ყველაზე საინტერესოა, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.

ასე რომ, … გამოყენებით სწრაფი ერთად ჩვენი საკუთარი მილსადენის კომპონენტი, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:

  • დოკუმენტი, რომელიც იკვებება შევიდა სწრაფი from MOSS.
  • ნორმალური crazy-obsessive სწრაფი დოკუმენტი დამუშავების და კატეგორიზაციის ხდება.
  • ჩვენი საკუთარი მილსადენის კომპონენტი მცირდება ზოგიერთი კონტექსტში ინფორმაციის off to მონაცემთა ბაზა.
  • პროცესში საკუთარი დიზაინი ნათქვამია კონტექსტში ინფორმაცია, აკეთებს რაღაც გადაწყვეტილება, თუ როგორ უნდა მოერგოს რომ MOSS დოკუმენტის ჩვენს ია და აღნიშნავს ის გამოყენებით ვებ სერვისი და ობიექტური მოდელის.

რა თქმა უნდა, ასეთი ავტომატიზირებული პროცესი შეიძლება იყოს სრულყოფილი რომ არა obsessive (და შესაძლოა გიჟური, მაგრამ, in-, კარგი გზა სწრაფი ადამიანი), ჩვენ შეიძლება ჰქონდეს რეალური საბრძოლო ესროლეს მართლაც ეფექტური მასის დატვირთვის პროცესი, რომელიც არ მეტი, ვიდრე უბრალოდ შეავსოთ SQL მონაცემთა ბაზა რამოდენიმე ძლივს-საძიებო დოკუმენტები.

</ბოლო>

გამოწერა ჩემი დღიური.

პროგრამები Tags: , ,

Faceted ძებნა ღობე Sitter მეტი

მე მქონდა მიზეზი დღეს პიესას ერთად codeplex faceted ძებნა project today.

ეს იყო დაახლოებით ხნით, მაგრამ მე იშურებდნენ ჩამოტვირთოთ და გამოიყენოთ ეს ჩვეულებრივი მიზეზები (ძირითადად დროის სიმცირის), plus outright fear 🙂

თუ ვეძებთ გააუმჯობესოს თქვენი ძებნა და შეისწავლონ ახალი არჩევანი, download it and install it when you have an hour or so of free time. I followed the installation manual’s instructions and it took me less than 20 minutes to have it installed and working. It provides value minute zero.

It does look pretty hard to extend. The authors provide a detailed walk-through for a complex BDC scenario. I may be missing it, but I wish they would also provide a simpler scenario involving one of the pre-existing properties or maybe adding one new managed property. I shall try and write that up myself in the next period of time.

ქვედა ხაზი — წუთებში, შეგიძლიათ დააყენოთ, კონფიგურირება, use it and add some pretty cool functionality to your vanilla MOSS search and be a hero 🙂

</ბოლო>

გამოწერა ჩემი დღიური.

პროგრამები Tags:

SharePoint WildCard ძებნა: “პრო” არ არის ღეროვანი of “პროგრამირებაში”

On MSDN ძებნა ფორუმი, ადამიანები ხშირად ითხოვენ კითხვაზე მსგავსი:

"I have a document named ‘Programming Guide’ but when I search for ‘Pro’ ძიების არ მიაგნეს."

მას შესაძლოა არ გრძნობს, როგორც ეს, but that amounts to a wildcard search. The MOSS/WSS user interface does not support wildcard search out of the box.

If you dig into the search web parts, you’ll find a checkbox, "Enable search term stemming". Stemming is a human-language term. It’s not a computer language substring() type function.

These are some stems:

  • "fish" is a stem to "fishing"
  • "major" is a stem to "majoring"

These are not stems:

  • "maj" is not a stem to "major"
  • "pro" is not a stem to "programmer"

The WSS/MOSS search engine does support wild card search through the API. Here is one blog article that describes how to do that: http://www.dotnetmafia.com/blogs/dotnettipoftheday/archive/2008/03/06/how-to-use-the-moss-enterprise-search-fulltextsqlquery-class.aspx

A 3rd party product, Ontolica, provides wild card search. I have not used that product.

</ბოლო>

გამოწერა ჩემი დღიური.

პროგრამები Tags: