<?php
include('FuzzyIndex.php');
$sentences = array(
'EN: * Euro holds above 3-1/2 month low versus dollar',
'EN: * Slight respite in Spain, Greek worries gives support but euro vulnerable',
'EN: * Euro near 3-1/2 year low vs sterling as BoE holds rates, QE',
'EN: The euro stayed close to a 3 1/2-month low against the dollar on Thursday and was expected to suffer further losses as political deadlock in Greece increased the risk of insolvency and a possible euro exit.',
'EN: The common currency gained a short-term reprive as stress in Spanish debt markets abated slightly and after Greece secured funds needed for bond repayments.',
'DE: Nach zwei gescheiterten Versuchen der stärksten Parteien ruhen die Hoffnungen nun auf Pasok-Parteichef Evangelos Venizelos.',
'DE: Der Sozialist kündigte am Donnerstag in Athen an, sich im "nationalen Interesse" an der schwierigen Aufgabe zu versuchen.',
'DE: Knackpunkt ist das mit den Geldgebern von EU und IWF vereinbarte Sparprogramm, für das es im Parlament keine Mehrheit mehr gibt.',
'DE: Die EZB machte deutlich, dass der Geldhahn bei einer Abkehr vom Sanierungskurs zugedreht wird:',
'DE: "Das Land kann keine weitere Hilfe erwarten, wenn es die Reformen nicht vorantreibt", mahnte EZB-Ratsmitglied Ewald Nowotny.',
'ES: José Ignacio Goirigolzarri, recién nombrado presidente ejecutivo de la nacionalizada Bankia y muy crÃtico con la reciente reforma bancaria del Gobierno, tendrá que coger el toro por los cuernos si quiere recuperar la confianza de los mercados internacionales en un banco saneado con dinero público.',
'ES: En febrero pasado, Goirigolzarri afirmó en su blog goirigolzarri.com que la reforma financiera aprobada en febrero por el Gobierno del Partido Popular no conllevarÃa un aumento del crédito.',
'ES: "(La) reforma del sistema financiero en nuestro paÃs, no va a traer un crecimiento del crédito (por mucho que se proclame desde todas las instancias), sino que debemos ser más realistas y precisos en nuestros objetivos", dijo.',
'AR: والخام الأمريكي مكاسبها المتواضعة يوم الخميس بعدما أظهر تقريران تراجعا Ø·ÙÙŠÙا لطلبات اعانة البطالة الأمريكية الأسبوع الماضي واتساع العجز التجاري الأمريكي بأكثر من المتوقع ÙÙŠ مارس اذار.',
'AR: وارتÙع برنت ÙÙŠ العقود الاجلة تسليم يونيو Øزيران 40 سنتا إلى 113.60 دولار للبرميل بØلول الساعة 1241 بتوقيت جرينتش بعد تداولات بين 112.57 Ùˆ113.64 دولار للبرميل.',
'AR: وارتÙعت العقود الاجلة للخام الأمريكي الخÙي٠تسليم يونيو 85 سنتا إلى 97.66 دولار بعد تداولات بين 96.08 Ùˆ97.69 دولار للبرميل.',
'AR: (إعداد Ù…Øمود عبد الجواد للنشرة العربية - تØرير عبد المنعم هيكل)',
'ZH: 业内人士表示,资本市场ä¸æ™¯æ°”ã€æ–°åŸºé‡‘销售低迷的åŒé‡å½±å“下,基金公å¸ä¹Ÿå¯„å¸Œæœ›äºŽæ›´å¤šçš„é”€å”®æ¸ é“,渴望与第三方支付ä¼ä¸šåˆä½œ,以带æ¥æ›´å¤šå®¢æˆ·èµ„æº.',
'ZH: 去年10月è¯ç›‘会对第三方基金销售平å°è¿›è¡Œå¼€é—¸,汇付数æ®ã€é€šè”支付ã€é“¶è”支付ã€æ˜“å®æ”¯ä»˜4家机构陆ç»èŽ·å¾—åŸºé‡‘ç¬¬ä¸‰æ–¹æ”¯ä»˜èµ„æ ¼.',
'ZH: 支付å®å…¬å¸æˆç«‹æ–¼2004å¹´,用户覆盖了整个C2C(个人对个人)ã€B2CåŠB2B(ä¼ä¸šå¯¹ä¼ä¸š)领域,æ ¹æ®å…¶å®˜æ–¹ç½‘站数æ®æ˜¾ç¤º,截至2011年末,å…¬å¸æ³¨å†Œç”¨æˆ·å·²çªç ´6.5亿.',
'ZH: 支付å®çš„æ¯å…¬å¸--阿里巴巴集团是ä¸å›½æœ€å¤§çš„电å商务集团,集团旗下B2B业务分支--阿里巴巴(1688.HK: 行情)已在香港上市.(完)',
'JP: [ウィーン 1ï¼æ—¥ã€€ãƒã‚¤ã‚¿ãƒ¼ï¼½ã€€æ¬§å·žä¸å¤®éŠ€è¡Œï¼ˆï¼¥ï¼£ï¼¢ï¼‰ç†äº‹ä¼šãƒ¡ãƒ³ãƒãƒ¼ã§ã‚るオーストリアä¸éŠ€ã®ãƒŽãƒœãƒˆãƒ‹ãƒ¼ç·è£ã¯ã€ãƒ¦ãƒ¼ãƒåœã‹ã‚‰ã®ã‚®ãƒªã‚·ãƒ£é›¢è„±ã®å¯èƒ½æ€§ã‚’è°è«–ã™ã‚‹ã«ã¯æ™‚期尚早ã ãŒã€æ”¹é©ã‚’進ã‚ã‚‹ã“ã¨ãŒã§ããªã‘ã‚Œã°å›½å¤–ã‹ã‚‰ã®æ”¯æ´ã¯ã“れ以上望ã‚ãªã„ã€ã¨ã®è¦‹è§£ã‚’示ã—ãŸã€‚',
'JP: åŒç·è£ã¯ã‚®ãƒªã‚·ãƒ£é›¢è„±ã®è¦‹é€šã—ã«é–¢ã™ã‚‹è¨˜è€…団ã®è³ªå•ã«ã€Œè°è«–ã™ã‚‹ã«ã¯æ™‚期尚早ã ã€ã¨æŒ‡æ‘˜ã€‚',
'JP: 「ç¾åœ¨è°è«–ã—ãªã‘ã‚Œã°ãªã‚‰ãªã„ã®ã¯ã€çŠ¶æ³ã‚’解決ã™ã‚‹ãŸã‚何ã«é›†ä¸ã™ã‚Œã°ã„ã„ã‹ã¨ã„ã†ã“ã¨ã 。解決ã®éµã¨ãªã‚‹ã®ã¯ã‚®ãƒªã‚·ãƒ£æ”¿åºœã¨æ”¿æ²»ã‚·ã‚¹ãƒ†ãƒ ã ã€ã¨è¿°ã¹ãŸã€‚',
'TH: à¸à¸±à¸™à¸”ับ 5 นายภิมุข เทียมเศวต จาà¸à¹‚รงเรียนเตรียมà¸à¸¸à¸”มศึà¸à¸©à¸² ได้คะà¹à¸™à¸™ 84.73 สà¸à¸šà¹„ด้คณะนิติศาสตร์ จุฬาลงà¸à¸£à¸“์มหาวิทยาลัย à¸à¸±à¸™à¸”ับ 6​ นางสาวศิริà¸à¸²à¸à¸ˆà¸™à¹Œ วิโรจน์ศิริ จาà¸à¹‚รงรียนสามเสนวิทยาลัย ได้คะà¹à¸™à¸™ 83.75 สà¸à¸šà¹„ด้คณะสถาปัตยà¸à¸£à¸£à¸¡à¸¨à¸²à¸ªà¸•à¸£à¹Œ จุฬาลงà¸à¸£à¸“์มหาวิทยาลัย à¸à¸±à¸™à¸”ับ 7 นายชนภัสส์ à¹à¸ªà¸‡à¸ªà¸§à¹ˆà¸²à¸‡ จาà¸à¹‚รงเรียนสาธิต จุฬาลงà¸à¸£à¸“์มหาวิทยาลัย ได้คะà¹à¸™à¸™ 83.09 สà¸à¸šà¹„ด้คณะทันตà¹à¸žà¸—ยศาสตร์ จุฬาลงà¸à¸£à¸“์มหาวิทยาลัย à¸à¸±à¸™à¸”ับ 8 นายมัคค์ วรสถิตย์ จาà¸à¹‚รงเรียนเตรียมà¸à¸¸à¸”มศึà¸à¸©à¸² ได้คะà¹à¸™à¸™ 82.93 สà¸à¸šà¹„ด้คณะเศรษà¸à¸¨à¸²à¸•à¸£à¹Œ จุฬาลงà¸à¸£à¸“์มหาวิทยาลัย à¹à¸¥à¸°à¸à¸±à¸™à¸”ับ 9 นางสาวนันทพัชร พนมยงค์ จาà¸à¹‚รงเรียนสตรีวิทยา ได้คะà¹à¸™à¸™ 82.02 สà¸à¸šà¹„ด้คณะพาณิชยศาสตร์à¹à¸¥à¸°à¸à¸²à¸£à¸šà¸±à¸à¸Šà¸µ มหาวิทยาลัยธรรมศาสตร์',
'TH: ด้านผู้พิà¸à¸²à¸£à¸—างสายตาที่ผ่านà¸à¸²à¸£à¸ªà¸à¸šà¸„ัดเลืà¸à¸à¹ƒà¸™à¸£à¸°à¸šà¸šà¸à¸¥à¸²à¸‡à¹à¸à¸”มิชช่ั่น ปี 2555 มีจำนวน 2 คนได้à¹à¸à¹ˆ 1. นายณัà¸à¸žà¸™à¸˜à¹Œ มูลมาตย์ จาà¸à¹‚รงเรียนเซนต์คาเบรียล สà¸à¸šà¹„ด้คณะครุศาสตร์ มรภ.บ้านสมเด็จเจ้าพระยา 2. นายไพโรจน์ พันธุ์ทà¸à¸‡ จาà¸à¹‚รงเรียนหาดใหà¸à¹ˆà¸§à¸´à¸—ยาลัย สà¸à¸šà¹„ด้คณะมนุษยศาสตร์à¹à¸¥à¸°à¸ªà¸±à¸‡à¸„มศาสตร์ มรภ.บ้านสมเด็จเจ้าพระยา ขณะที่คณะ/สาขาที่มีผู้สมัครมาà¸à¸—ี่สุด 20 à¸à¸±à¸™à¸”ับà¹à¸£à¸ สำหรับà¹à¸à¸”มิชชั่นปี 2555 à¸à¸±à¸™à¸”ับ 1 ได้à¹à¸à¹ˆ วิทยาลัยพยาบาลตำรวจ วิทยาลัยพยาบาลตำรวจ จำนวนที่รับได้ 56 คน มีผู้สมัคร 2,850 คน คิดเป็นà¸à¸±à¸•à¸£à¸²à¸ªà¹ˆà¸§à¸™ 1:51',
'TH: ด้านนายสมคิด เลิศไพฑูรย์ à¸à¸˜à¸´à¸à¸²à¸£à¸šà¸”ีมหาวิทยาลัยธรรมศาสตร์ (มธ.) ในà¸à¸²à¸™à¸°à¸›à¸£à¸°à¸˜à¸²à¸™à¸—ี่ประชุมà¸à¸˜à¸´à¸à¸²à¸£à¸šà¸”ีà¹à¸«à¹ˆà¸‡à¸›à¸£à¸°à¹€à¸—ศไทย (ทปà¸.) à¹à¸¥à¸°à¸™à¸²à¸¢à¸à¸ªà¸¡à¸²à¸„มà¸à¸˜à¸´à¸à¸²à¸£à¸šà¸”ีà¹à¸«à¹ˆà¸‡à¸›à¸£à¸°à¹€à¸—ศไทย (สà¸à¸—.) à¸à¸¥à¹ˆà¸²à¸§à¸”้วยว่า à¸à¸²à¸£à¸›à¸£à¸°à¸à¸²à¸¨à¸œà¸¥à¸—างเว็บไซต์นั้น จะมีข้à¸à¸¡à¸¹à¸¥ ชื่à¸-นามสà¸à¸¸à¸¥ เลขที่สมัคร à¹à¸¥à¸°à¸£à¸«à¸±à¸ªà¸„ณะที่ผ่านà¸à¸²à¸£à¸„ัดเลืà¸à¸ à¹à¸•à¹ˆà¸ˆà¸°à¹„ม่มีข้à¸à¸¡à¸¹à¸¥à¸ªà¸–านที่สà¸à¸šà¸ªà¸±à¸¡à¸ าษณ์ วันà¹à¸¥à¸°à¹€à¸§à¸¥à¸²à¸à¸²à¸£à¸ªà¸à¸šà¸ªà¸±à¸¡à¸ าษณ์ ดังนั้น เมื่à¸à¸™à¸±à¸à¹€à¸£à¸µà¸¢à¸™à¸—ราบผลà¸à¸²à¸£à¸„ัดเลืà¸à¸à¹à¸¥à¹‰à¸§ ให้นัà¸à¹€à¸£à¸µà¸¢à¸™à¸ˆà¸£à¸§à¸ˆà¸ªà¸à¸šà¸ªà¸–านที่ วัน à¹à¸¥à¸°à¹€à¸§à¸¥à¸²à¸à¸²à¸£à¸ªà¸à¸šà¸ªà¸±à¸¡à¸ าษณ์ทางเว็บไซต์ขà¸à¸‡à¸ªà¸¡à¸²à¸„มà¸à¸˜à¸´à¸à¸²à¸£à¸šà¸”ีà¹à¸«à¹ˆà¸‡à¸›à¸£à¸°à¹€à¸—ศไทย à¹à¸¥à¸°à¸‚à¸à¹ƒà¸«à¹‰à¸™à¸±à¸à¹€à¸£à¸µà¸¢à¸™à¹€à¸”ินทางไปสà¸à¸šà¸ªà¸±à¸¡à¸ าษณ์ให้ตรงตามเวลา วันที่ à¹à¸¥à¸°à¸ªà¸–านที่ที่มหาวิทยาลัยà¸à¸³à¸«à¸™à¸”ไว้ระหว่างวันที่ 14-16 พฤษภาคม 2555.',
'TR: Sivas’ta iki otomobilin çarpışması sonucu meydana gelen kazada 2 kişi yaralandı.',
'TR: Kazada çarpışmanın etkisi ile araçlardan birinin ortadan ikiye bölünmesi görenleri şaşırttı.',
'TR: Kaza, bugün sabah saatlerinde Şeyhşamil Mahallesi Türkmenistan Caddesi üzerindeki kavşakta meydana geldi.',
'TR: 20 yaşındaki Abdulmuttalip Öztürk yönetimindeki 58 NU 269 plakalı otomobil ile 19 yaşındaki Ömer Akpolat yönetimindeki 58 FE 554 plakalı otomobil aşırı hız nedeniyle çarpıştı.',
'TR: Çarpışmanın etkisiyle Ömer Akpolat yönetimindeki otomobil ikiye bölünerek savruldu.',
'TR: Akpolat ise otomobilin ikiye bölünmesi ile yola fırladı.',
);
$heuristics = array(
'CharsHeuristic',
'LowercaseCharsHeuristic',
'WordCharsHeuristic',
'LowercaseWordCharsHeuristic',
'WordChunkHeuristic',
'LowercaseWordChunkHeuristic',
'WordHeuristic',
'LowercaseWordHeuristic'
);
$stats = array();
$tmpfile = '/tmp/tmp.db';
foreach($heuristics as $heuristic){
print $heuristic."\n";
$stats[$heuristic] = array();
@unlink($tmpfile);
$fi = new FuzzyIndex($tmpfile);
$fi->setHeuristic($heuristic);
$t1 = microtime(true);
load_sentences($fi, $sentences);
$t2 = microtime(true);
$diff = $t2-$t1;
$stats[$heuristic]['loadtime'] = $diff;
$stats[$heuristic]['dbsize'] = filesize($tmpfile);
$snippets = $fi->getHeuristic()->makeSnippets($sentences[3]);
$stats[$heuristic]['snippets'] = implode(' ', $snippets);
$t1 = microtime(true);
$hits = lookupList($fi, $sentences);
$t2 = microtime(true);
$diff = $t2-$t1;
$stats[$heuristic]['lookuptime'] = $diff;
$stats[$heuristic]['combinedscore'] = getCombinedScore($hits);
//exit;
}
print "heuristic \t loadtime (s) \t dbsize (KB) \t lookup 32 items (s) \t avg score (%)".$sentences[3]."\n";
foreach($stats as $key=>$info){
print $key."\t".round($info['loadtime'], 2)."\t".round($info['dbsize']/1000.0, 2)."\t".round($info['lookuptime'], 2)."\t".$info['combinedscore']."\t".$info['snippets']." \n";
}
function load_sentences(&$fi, $sentences){
foreach($sentences as $s){
$string = substr($s, 4);//chop off language id
$fi->insert_string($string, $s);
}
}
function getCombinedScore($hits){
$num = count($hits);
$sum=0;
foreach($hits as $hit){
if ( is_string($hit)){
$parts = explode(' | ', $hit);
if ( isset($parts[2])){
$sum += $parts[2];
}
}
}
return round($sum*1.0/$num, 2);
}
function lookupList($fi, $list){
$besthits = array();
foreach($list as $item){
$item = substr($item, 0, 10).'EDIT'.substr($item, 10); // fuzzify
//print "looking up $item\n";
$besthits[] = lookupItem($fi, $item);
//print_r($besthits);
}
return $besthits;
}
function lookupItem($fi, $item){
//print "looking up item: $item\n";
$bestlocations = $fi->get_best_locations($item);
$numloc = count($bestlocations);
if ( $numloc && $numloc > 0 ){
$firstitem = array_shift($bestlocations);
return $firstitem; // location, score
//print $firstitem."\n";
}
return array('', 0);
//else{
//print "no match found\n";
//}
//var_dump($bestlocations);
}
?>
|