Hi,

Habe selbst eine AND/OR/NOT/""/() -> monsterSQL Klasse programmiert.

NEAR wird jedoch komplex... Da musst Du die Texte n�mlich indizieren...
Beispiel:
        Text 1: Dies ist ein total einfacher Test
Das ergibt indiziert:
        TextNr, Pos, wort
        1, 1, Dies
        1, 2, ist
        1, 3, ein
        1, 4, total
        1, 5, einfacher
        1, 6, Test

Dann w�rde ein "wort1 NEAR wort2" zu �bersetzen sein in:
Select * from texte t1,texte t2 WHERE t1.textNr=t2.TextNr and
t1.wort="wort1" and t2.wort="wort2" and abs(t1.pos-t2.pos)<=5  (->NEAR
sind worte, die nicht weiter als 5 W�rter auseinander sind..)

Was die Wichtigkeit angeht kannst Du beliebig komplexe Sachen machen,
aber Du kommst hier wahrscheinlich nicht mehr mit SQL aus...
Z.B. Suche in HTML: Worte, die innerhalb von �berschriften vorkommen
werden h�her gewertet als wenn es im normalen Text vorkommt etc...

Ansonsten kommst Du ein gutes St�ck weiter, wenn Du Dir mal den
Indexing-Server/Service anschaust... Damit kannst Du sowohl Dateien als
auch den SQLServer indizieren und der bietet auch eine abgestuftere
Wichtigkeit und NEAR(nicht sicher!)

Ansonsten: Wie weit willst Du gehen? Bei komplexen Funktionen kommst Du
irgendwann nicht mehr drum herum die Daten gesondert nochmal in einem
dem Such-Problem angepassten Format vorzuhalten - entweder in Dateien
oder RAM... Und damit kommen nat�rlich all die Probleme die Daten
Konsostent zu halten etc . auf Dich zu..
Schau mal, ob Dir der Indexing-Service reicht...

Hier ein Artikel dazu, wie Google funktioniert:
http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm
Google nutzt �brigens ~7000 PCs, um die Anfragen abzuarbeiten...

Claudius

> 
> Hallo Liste
> 
> Habe da ein kleines Problem. Brauche Ideen, wie man dies 
> l�sen k�nnte...
> irgend wer hat sowas sicher schon getan.
> 
> Es get darum, dass man ne Suchmaschine �ber einen Inhalt 
> einer Datenbank
> will (Recordset finden)
> Die Suchmaschine soll Funktionalit�t wie AND, OR, NOT, NEAR, "", ...
> unterst�tzen.
> Nun meine Frage; wie programmiert man sowas?
> Habe bis jetzt ne Suchfunktion, welche mit AND, OR und NOT 
> funktioniert. Die
> Suchresultate k�nnen jedoch nur sehr sehr begrenzt nach 
> Wichtigkeit sortiert
> werden (z.B. bei OR, kommen beide Begriffe vor, oder nur einer)...
> Wie muss man dies machen, damit es ne komplexe Abstufung 
> gibt? Wie muss man
> das mit nem NEAR machen? Welche Ans�tze w�hlt man am besten 
> zur Behandlung
> von allf�lligen Klammern?
> -> Bsp: Test AND (GUGUS OR HALLO)
> 
> Hat da jemand ne Idee, was f�r "Hash" Tabellen ich da 
> generieren sollte? Wie
> man so etwas professionell machen kann?
> Komme mit der Variante, dass einfach ein monster SQL Query 
> generiert wirdt
> nicht mehr weiter... wie mache ich das? Wertlisten in's RAM laden?
> 
> Bin f�r jeden Hinweis (ob Theorie, CodeBeispiel, Anregung, ...) froh.
> -> Genial w�r nat�rlich, wenn mir ein Google Entwickler den 
> Code senden
> w�rde;-)
> 
> Gruss
> 
> Christian
> ----- Original Message -----
> From: "Christian Thuer" <[EMAIL PROTECTED]>
> To: "AspGerman Kaffeehaus" <[EMAIL PROTECTED]>
> Sent: Wednesday, May 22, 2002 6:53 PM
> Subject: [aspdecoffeehouse] Re: maximale Verbindungen
> 
> 
> > Ressourcen habe ich nirgends.
> > Aber wenn's nur um Socket's geht; also nicht die Beschr�nkung des
> Dienstes,
> > denke ich dass du proablemlos auf 1000 Verbindungen kommen kannst.
> > -> Bis zu 400 habe ich mal ausgetestet...
> >
> > Theoretisch ist es Unbegrenzt (oder so gut wie); irgendwann 
> bricht die
> > Performance einfach ein.
> > Was sind es denn f�r Verbindungen?
> >
> > F�r Systeme mit sehr vielen parallelen Verbindungen 
> empfiehlt sich ein
> Unix
> > (neuerer Berkley Sock als in Windows)... ansonsten w�rde ich auf UDP
> > umsteigen, da kann das OS einiges mehr bieten, da der Stack weniger
> komplex
> > ist.
> >
> > Gruss
> >
> > Christian
> > ----- Original Message -----
> > From: <[EMAIL PROTECTED]>
> > To: "AspGerman Kaffeehaus" <[EMAIL PROTECTED]>
> > Sent: Wednesday, May 22, 2002 6:23 PM
> > Subject: [aspdecoffeehouse] maximale Verbindungen
> >
> >
> > > Hi Leute,
> > >
> > > kann mir jemand verrraten wieviele LAN Verbindungen man maximal
> > gleichzeitig
> > > von W9x und W2k prof. zu einem Windows 2000 professional Rechner
> aufbauen
> > > kann?
> > >
> > > Oder kennt jemand eine Seite wo ich dies nachlesen kann?
> > >
> > > Thanks
> > >
> > > --
> > > GMX - Die Kommunikationsplattform im Internet.
> > > http://www.gmx.net
> > >
> > >
> > > | [aspdecoffeehouse] als [EMAIL PROTECTED] subscribed
> > > | http://www.aspgerman.com/archiv/aspdecoffeehouse/ = Listenarchiv
> > > | Sie k�nnen sich unter folgender URL an- und abmelden:
> > > |
> http://www.aspgerman.com/aspgerman/listen/anmelden/aspdecoffee
house.asp
> >
>
>
> | [aspdecoffeehouse] als [EMAIL PROTECTED] subscribed
> | http://www.aspgerman.com/archiv/aspdecoffeehouse/ = Listenarchiv
> | Sie k�nnen sich unter folgender URL an- und abmelden:
> |
http://www.aspgerman.com/aspgerman/listen/anmelden/aspdecoffeehouse.asp
>


| [aspdecoffeehouse] als [EMAIL PROTECTED] subscribed
| http://www.aspgerman.com/archiv/aspdecoffeehouse/ = Listenarchiv
| Sie k�nnen sich unter folgender URL an- und abmelden:
|
http://www.aspgerman.com/aspgerman/listen/anmelden/aspdecoffeehouse.asp


| [aspdecoffeehouse] als [email protected] subscribed
| http://www.aspgerman.com/archiv/aspdecoffeehouse/ = Listenarchiv
| Sie k�nnen sich unter folgender URL an- und abmelden:
| http://www.aspgerman.com/aspgerman/listen/anmelden/aspdecoffeehouse.asp

Antwort per Email an