<html><head></head><body><div style="font-family: Verdana;font-size: 12.0px;"><div>Hi
<div>
<div>
<div>&nbsp;</div>

<div>&gt; Rue, Ruelle, Avenue, Boulevard, Quai, Chauss&eacute;e, Route, Cour, Cours, Cit&eacute;, Chemin, Place, Esplanade, Passage, All&eacute;e, Carrefour, Sentier, Square, Villa.<br/>
&gt;<br/>
&gt; This list is without a doubt not complete but should cover more than 95% of named addresses in France.<br/>
&gt;<br/>
&gt; They should only be ignored from index if they&#39;re in the first place and followed by anything else.</div>

<div>&nbsp;</div>
just to make sure, phrases which start with a stopword should be ignored from index if the phrase is not the original name of the street. The original street name should be always inserted to index.</div>

<div>&nbsp;</div>

<div>For example:<br/>
in German(Germany) the list of stopwords looks like<br/>
&quot;Stra&szlig;e&quot;, &quot;Strasse&quot;, &quot;Weg&quot;, &quot;Ring&quot;<br/>
But the streets &quot;Stra&szlig;e des 17. Juni&quot; or &quot;Stra&szlig;e 19&quot; have to be inserted into the index.<br/>
(yes, the street &quot;Stra&szlig;e 19&quot; really exists, see OSM way 46115660)</div>

<div><br/>
Regards,<br/>
Gert</div>

<div>&nbsp;</div>

<div>&nbsp;</div>

<div>&nbsp;</div>

<div>&nbsp;</div>

<div>&nbsp;</div>

<div style="margin:0 0 10px 0;"><b>Gesendet:</b>&nbsp;Samstag, 14. Februar 2015 um 15:06 Uhr<br/>
<b>Von:</b>&nbsp;&quot;Paco Tyson&quot; &lt;paco.tyson@free.fr&gt;<br/>
<b>An:</b>&nbsp;&quot;Development list for mkgmap&quot; &lt;mkgmap-dev@lists.mkgmap.org.uk&gt;<br/>
<b>Betreff:</b>&nbsp;Re: [mkgmap-dev] mixed index branch merge</div>

<div name="quote" style="margin:10px 5px 5px 10px; padding: 10px 0 10px 10px; border-left:2px solid #C3D9E5; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">
<div name="quoted-content">Hi all,<br/>
<br/>
In French, from the top of my head, I can think of :<br/>
<br/>
Rue, Ruelle, Avenue, Boulevard, Quai, Chauss&eacute;e, Route, Cour, Cours, Cit&eacute;, Chemin, Place, Esplanade, Passage, All&eacute;e, Carrefour, Sentier, Square, Villa.<br/>
<br/>
This list is without a doubt not complete but should cover more than 95% of named addresses in France.<br/>
<br/>
They should only be ignored from index if they&#39;re in the first place and followed by anything else.<br/>
<br/>
<br/>
Cheers,<br/>
Paco<br/>
<br/>
Le 14 f&eacute;vr. 2015 &agrave; 08:50, Marko M&auml;kel&auml; &lt;marko.makela@iki.fi&gt; a &eacute;crit :<br/>
<br/>
&gt; On Thu, Feb 12, 2015 at 01:24:29PM +0000, Steve Ratcliffe wrote:<br/>
&gt;&gt; So finally I will merge the mixed index branch.<br/>
&gt;<br/>
&gt; I believe that the database terminology for this is &#39;inverted index&#39; or &#39;fulltext index&#39;.<br/>
&gt;<br/>
&gt;&gt; I think it would be best to selectively enable it per country along with lists of names to avoid. This would be best done by people from or familiar with the countries in question.<br/>
&gt;<br/>
&gt; In fulltext search, these are called &#39;stopwords&#39;.<br/>
&gt;<br/>
&gt; It might not be necessary to do anything to for countries where street names are commonly written as a single word. Example: &quot;Main Street&quot; would be &quot;Hauptstrasse&quot; in German, &quot;Huvudgatan&quot; in Sweden and &quot;P&auml;&auml;tie&quot; in Finnish. Only if the first part of the street name is a proper name such as a person&#39;s name, the second part could be written as a separate word, separated by a space or dash.<br/>
&gt;<br/>
&gt; That said, I guess it would still make sense to introduce some stopwords. Words that I can think of:<br/>
&gt;<br/>
&gt; Swedish: gata, gatan, gr&auml;nd, gr&auml;nden, stig, stigen, (str&aring;k, str&aring;ket)<br/>
&gt; Finnish: tie, katu, polku, kuja, (raitti, taival)<br/>
&gt; German: Stra&szlig;e, Strasse, Weg, Allee, Chaussee<br/>
&gt; Estonian: mnt, maantee, tn, t&auml;nav, pst, puiestee<br/>
&gt;<br/>
&gt; In Estonia, it seems to be common to write the tn, mnt or pst as a separate word.<br/>
&gt;<br/>
&gt; I could be missing some stopwords in Estonian and for German-speaking countries. Also, it could be that the French loan words Allee and Chaussee are sometimes accented.<br/>
&gt;<br/>
&gt; The Finnish and Swedish words that I have put in parenthesis should be very rare, typically used for ways for non-motorized traffic. I don&#39;t think that including them would pollute the index much. You might in fact want to search for such a name when you are looking for a nice walking or cycling route (i.e., you expect there to exist some random-famous-person-name-str&aring;ket, but you do not know the random name).<br/>
&gt;<br/>
&gt; Marko<br/>
&gt; _______________________________________________<br/>
&gt; mkgmap-dev mailing list<br/>
&gt; mkgmap-dev@lists.mkgmap.org.uk<br/>
&gt; <a href="http://www.mkgmap.org.uk/mailman/listinfo/mkgmap-dev" target="_blank">http://www.mkgmap.org.uk/mailman/listinfo/mkgmap-dev</a><br/>
<br/>
_______________________________________________<br/>
mkgmap-dev mailing list<br/>
mkgmap-dev@lists.mkgmap.org.uk<br/>
<a href="http://www.mkgmap.org.uk/mailman/listinfo/mkgmap-dev" target="_blank">http://www.mkgmap.org.uk/mailman/listinfo/mkgmap-dev</a></div>
</div>
</div>
</div>

<div>&nbsp;</div>

<div class="signature">&nbsp;</div></div></body></html>