<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 12pt;
font-family:Calibri
}
--></style></head>
<body class='hmmessage'><div dir='ltr'>Hi Steve,<br><br>I fear I don't understand what problem you see<br>with roads like 'The Avenue'<br>My understanding is that we put the full name into the<br>index, so the road can be found. On the other hand,<br>nobody would expect to find this road by typing <br>just avenue, right?<br><br>Gerd<br><br><div>&gt; Date: Mon, 16 Feb 2015 00:21:26 +0000<br>&gt; From: steve@parabola.me.uk<br>&gt; To: mkgmap-dev@lists.mkgmap.org.uk<br>&gt; Subject: Re: [mkgmap-dev] mixed index branch merge<br>&gt; <br>&gt; <br>&gt; Hi<br>&gt; <br>&gt; There are some interesting comments here.<br>&gt; <br>&gt; I did have code to count the number of times certain words appeared in<br>&gt; a name in attempt to automatically create a stop word list for a map.<br>&gt; It turned out that it wasn't all that useful, for England at least.<br>&gt; <br>&gt;  From the numbers you get stop words such as 'The', 'Avenue' and<br>&gt; 'Road' as you would expect.  However many streets have names such as<br>&gt; 'The Avenue' 'Avenue Road' and so on that consist entirely of<br>&gt; likely stop words. And these are not theoretical names that occur<br>&gt; infrequently, these are names of streets that I know.<br>&gt; <br>&gt; I think we really need to be able to identify which parts of the<br>&gt; name are useful to index, rather than which parts are not.<br>&gt; <br>&gt; So for England I think that the only rule required is to index from<br>&gt; the beginning of the name, as now.<br>&gt; <br>&gt; For places where streets are named after people and there is<br>&gt; no word for 'street' included, and the street is generally<br>&gt; refered to by the second name then probably adding entries<br>&gt; for all parts of the name will work.<br>&gt; <br>&gt; For places where there is a word for street at the beginning<br>&gt; then we have to step over that word and any following<br>&gt; prepositions etc.  So for France not just<br>&gt; "Rue", but any following "de", "des", "d'" etc.<br>&gt; <br>&gt; The required action does of course depend on language rather than<br>&gt; country, but we don't in general have the language, so we will have to<br>&gt; start out using the country (or perhaps region) and see how that goes.<br>&gt; I suspect it will work quite well, but if not we can think of<br>&gt; something else when the problems are more well known.<br>&gt; <br>&gt; I guess we will start out having configurable rule types and<br>&gt; word lists, but we need to gather sensible defaults once<br>&gt; a working system is developed for each country.<br>&gt; <br>&gt; ..Steve<br>&gt; _______________________________________________<br>&gt; mkgmap-dev mailing list<br>&gt; mkgmap-dev@lists.mkgmap.org.uk<br>&gt; http://www.mkgmap.org.uk/mailman/listinfo/mkgmap-dev<br></div>                                               </div></body>
</html>