<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Hi ,<div><br></div><div>we solved the indexing problem by MD5 the string. This effectively solved the 256 symbols problem.</div><div>Just an idea…</div><div><br></div><div>regards</div><div><br></div><div>Bart</div><div><br></div><div><br><div><div>On 28 Aug 2012, at 15:09, George Parkinson wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div><div style="color:#000; background-color:#fff; font-family:arial, helvetica, sans-serif;font-size:10pt"><div><span>hi ruslan,</span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span>the problem is two-fold...</span><span style="font-size: 10pt; ">storage and </span><span style="font-size: 10pt; ">indexing</span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span><br></span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span><div style="background-color: transparent; "><span style="background-color: transparent; ">1 - storage: for this project,  </span><span style="font-size: 10pt; ">i ship out read-only survey results.   </span></div><div style="font-size: 10pt; background-color: transparent; "><span style="font-size: 10pt; ">clients never start with an empty db...they consume what is shipped.</span></div><div style="font-size: 10pt; background-color: transparent; "><span style="background-color: transparent; ">i'm going to have major push back from clients (000's) when i replace what i ship now with something approaching twice the size.  </span></div><div style="background-color: transparent; "><br></div></span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span>2 - indexing: the first 256 symbols of each record is indeed 256 when using utf8, but becomes 128 when using utf16.</span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family:
 arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span>i have a field of 188 characters (ascii 34-127) that is essentially the index...but with utf16 indexing won't work.</span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span><br></span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span>splitting into two fields, with each indexed won't work because the 128 symbol limit is for the record.</span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span style="background-color: transparent; ">dropping the index is not an option because of the volume of data
 (hundreds of thousands of records a month with an average retention of 4 yrs). </span><br></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><br></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span style="background-color: transparent; ">this is why i'm looking for utf8 in valentina.</span><br></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span style="background-color: transparent; "><br></span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span style="background-color:
 transparent; ">thanks,</span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><span style="background-color: transparent; ">george</span></div><div style="color: rgb(0, 0, 0); font-size: 13.600000381469727px; font-family: arial, helvetica, sans-serif; background-color: transparent; font-style: normal; "><br></div><div><br></div>  <div style="font-family: arial, helvetica, sans-serif; font-size: 10pt; "> <div style="font-family: 'times new roman', 'new york', times, serif; font-size: 12pt; "> <div dir="ltr"> <font size="2" face="Arial"> <hr size="1">  <b><span style="font-weight:bold;">From:</span></b> Ruslan Zasukhin <<a href="mailto:ruslan_zasukhin@valentina-db.com">ruslan_zasukhin@valentina-db.com</a>><br> <b><span style="font-weight: bold;">To:</span></b> "<a href="mailto:valentina@lists.macserve.net">valentina@lists.macserve.net</a>" <<a href="mailto:valentina@lists.macserve.net">valentina@lists.macserve.net</a>> <br> <b><span style="font-weight: bold;">Sent:</span></b>
 Tuesday, August 28, 2012 2:33:09 AM<br> <b><span style="font-weight: bold;">Subject:</span></b> Re: odd indexed string behaviour?<br> </font> </div> <br>On 8/28/12 4:52 AM, "George Parkinson" <<a ymailto="mailto:george@microtherapy.ca" href="mailto:george@microtherapy.ca">george@microtherapy.ca</a>> wrote:<br><br>Hi George,<br><br>> ok "utf16 for now".<br>> <br>> i really want to use valentina for a major project but the lack of utf8 is a<br>> roadblock. <br><br>Why? <br><br>Do you going to use TEXT Fields?<br>If yes, you can use ZIP compression still having indexing.<br><br>I hard see that today size of db can matter  ...<br>HDDs are so cheap .<br><br> <br>> will it become reality?  and if so, can you estimate when?<br><br>Yes why not, <br><br>When we seat and fix that utf8 related issues.<br><br>-- <br>Best regards,<br><br>Ruslan Zasukhin<br>VP Engineering and New Technology<br>Paradigma Software,
 Inc<br><br>Valentina - Joining Worlds of Information<br><a href="http://www.paradigmasoft.com/" target="_blank">http://www.paradigmasoft.com</a><br><br>[I feel the need: the need for speed]<br><br><br>_______________________________________________<br>Valentina mailing list<br><a ymailto="mailto:Valentina@lists.macserve.net" href="mailto:Valentina@lists.macserve.net">Valentina@lists.macserve.net</a><br><a href="http://lists.macserve.net/mailman/listinfo/valentina" target="_blank">http://lists.macserve.net/mailman/listinfo/valentina</a><br><br><br> </div> </div>  </div></div>_______________________________________________<br>Valentina mailing list<br><a href="mailto:Valentina@lists.macserve.net">Valentina@lists.macserve.net</a><br>http://lists.macserve.net/mailman/listinfo/valentina<br></blockquote></div><br></div></body></html>