{"version":"1.0","provider_name":"\u0427\u0443\u0434\u043e{\u0432\u0438\u0449\u043d\u044b\u0435} \u0437\u0430\u043c\u0435\u0442\u043a\u0438","provider_url":"https:\/\/miracle.rpz.name","author_name":"MiRacLe","author_url":"https:\/\/miracle.rpz.name\/author\/miracle\/","title":"Xpath vs regexp.","html":"<p>\u0421\u0442\u043e\u044f\u043b\u0430 \u0437\u0430\u0434\u0430\u0447\u0430 - \u0441\u043e\u0431\u0440\u0430\u0442\u044c \u043d\u0435\u043a\u0443\u044e \u0438\u0445 \u0441\u0442\u0430\u0442\u0438\u0447\u043d\u044b\u0445 html-\u0444\u0430\u0439\u043b\u043e\u0432,\u0432 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u043c \u0442\u0430\u0431\u043b\u0438\u0447\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0438 \u0435\u0449\u0451 \u043d\u0435\u043c\u043d\u043e\u0433\u043e \u0432\u0441\u0435\u0433\u043e \u043f\u043e \u0432\u0435\u0440\u0448\u043a\u0430\u043c. \u0412\u0451\u0440\u0441\u0442\u043a\u0430 \u043d\u0435 \u0430\u0445\u0442\u0438, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u0432\u0441\u0442\u0430\u043b \u0432\u043e\u043f\u0440\u043e\u0441 \u043e \u0442\u043e\u043c \u0447\u0442\u043e \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0441\u0442\u0440\u0430\u043d\u0438\u0446\u044b \u043f\u0440\u0438\u0434\u0451\u0442\u0441\u044f \"\u043f\u0430\u0440\u0441\u0438\u0442\u044c \u0432\u0440\u0443\u0447\u043d\u0443\u044e\"\u2026 \u0417\u0430\u043a\u043e\u043d\u043e\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438 \u0435\u0441\u0442\u044c, \u043d\u043e \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u043c\u043d\u043e\u0433\u043e \u0443\u0441\u043b\u043e\u0432\u043d\u043e\u0441\u0442\u0435\u0439 (\u0433\u0434\u0435-\u0442\u043e \u0435\u0441\u0442\u044c class,\u0433\u0434\u0435-\u0442\u043e id, \u0433\u0434\u0435-\u0442\u043e \u0432 table \u0435\u0441\u0442\u044c tbody \u0438 \u0442.\u043f.) \u2026<br \/><\/p>\u041a\u0430\u0437\u0430\u043b\u043e\u0441\u044c \u0431\u044b \u043d\u0438\u0447\u0435\u0433\u043e \u0441\u043b\u043e\u0436\u043d\u043e\u0433\u043e - \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u043d\u044b\u0435 \u0432\u044b\u0440\u0430\u0436\u0435\u043d\u0438\u044f \u0432\u0440\u043e\u0434\u0435 \u0431\u044b \u043f\u0440\u043e\u0441\u0442\u043e \u0441\u043e\u0437\u0434\u0430\u043d\u044b \u0434\u043b\u044f \u044d\u0442\u043e\u0433\u043e... \u043d\u043e \u043c\u043d\u0435 \u043a\u0430\u043a-\u0442\u043e \u043d\u0435\u0443\u043b\u044b\u0431\u0430\u043b\u043e\u0441\u044c \u0438\u0445 \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0442\u044c\u2026 \u0418 \u0442\u0443\u0442 \u044f \u0432\u0441\u043f\u043e\u043c\u043d\u0438\u043b \u0447\u0442\u043e \u0441\u043e\u0432\u0441\u0435\u043c \u043d\u0435\u0434\u0430\u0432\u043d\u043e, \u0438\u0441\u0441\u043b\u0435\u0434\u0443\u044f <a href=\"http:\/\/mozdev.org\">mozdev.org<\/a> \u043d\u0430\u0442\u043a\u043d\u0443\u043b\u0441\u044f \u043d\u0430 \u043f\u043b\u0430\u0433\u0438\u043d \u043a firefox-\u0443, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0437\u043e\u0432\u0451\u0442\u0441\u044f <a href=\"http:\/\/xpath.alephzarro.com\/\">Xpather<\/a>.\u041e\u043d \u043f\u043e\u043c\u0438\u043c\u043e \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u0439 \u0441\u0432\u043e\u0435\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 (\u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043d\u0443\u0436\u043d\u044b\u0435 \u043d\u043e\u0434\u044b \u043f\u043e \u043f\u0443\u0442\u0438 \u0438 \u043f\u0443\u0442\u044c \u0432\u044b\u0431\u0440\u0430\u043d\u043d\u043e\u0439 \u043d\u043e\u0434\u044b), \u0438\u043c\u0435\u0435\u0442 \u043a\u0440\u0430\u0442\u0435\u043d\u044c\u043a\u0443\u044e \u0441\u043f\u0440\u0430\u0432\u043a\u0443, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043e\u0442\u043a\u0440\u044b\u043b\u0430 \u0433\u043b\u0430\u0437\u0430 \u043d\u0430 \u043b\u0451\u0433\u043a\u043e\u0441\u0442\u044c \u043d\u0430\u043f\u0438\u0441\u0430\u043d\u0438\u044f \"\u043d\u0435\u043f\u043e\u043d\u044f\u0442\u043d\u044b\u0445 \u0437\u0430\u0431\u043e\u0440\u043e\u0432 \u0438 \u0437\u0430\u043a\u043e\u0440\u044e\u0447\u0435\u043a\".<br \/><br \/>&nbsp; \"\u041e\u0442\u043b\u0438\u0447\u043d\u043e\" - \u043f\u043e\u0434\u0443\u043c\u0430\u043b \u044f - \"\u0442\u0430\u043a \u0442\u043e\u043c\u0443 \u0438 \u0431\u044b\u0442\u044c\u2026\". \u041e\u0441\u0442\u0430\u043b\u043e\u0441\u044c \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u0442\u044c \u0438\u043c\u0435\u044e\u0449\u0443\u044e\u0441\u044f \u0432 \u043d\u0430\u043b\u0438\u0447\u0438\u0438 \u0441\u043e\u0432\u0441\u0435\u043c \u043d\u0435\u0432\u0430\u043b\u0438\u0434\u043d\u0443\u044e html-\u043a\u0443 \u0432 xml. <a href=\"http:\/\/php.net\/tidy\">Tidy<\/a> \u043c\u043d\u0435 \u043f\u043e\u043c\u043e\u0447\u044c \u043e\u0442\u043a\u0430\u0437\u0430\u043b\u0441\u044f (\u0438\u043b\u0438, \u0447\u0442\u043e \u0432\u0435\u0440\u043d\u0435\u0435,\u044f \u043d\u0435 \u0443\u043c\u0435\u044e \u0435\u0433\u043e \u0433\u043e\u0442\u043e\u0432\u0438\u0442\u044c) , <a href=\"http:\/\/php.net\/manual\/en\/function.tidy-clean-repair.php\">tidy_clean_repair<\/a> \u043f\u0440\u0435\u0434\u043b\u0430\u0433\u0430\u043b \u043c\u043d\u0435 \"\u0438\u0441\u043f\u0440\u0430\u0432\u0438\u0442\u044c\" \u0440\u0430\u0437\u043c\u0435\u0442\u043a\u0443 \u0438 \u0442.\u0434. \u0438 \u0442.\u043f. \u0422\u0443\u0442 \u0436\u0435 \u0432\u0441\u043f\u043e\u043c\u043d\u0438\u043b\u0441\u044f \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u043a\u043b\u0430\u0441\u0441 <a href=\"http:\/\/pixel-apes.com\/safehtml\/\">SafeHTML<\/a> ( \u043e\u043d \u0442\u0430\u043a \u0436\u0435 \u043f\u0440\u043e\u0436\u0438\u0432\u0430\u0435\u0442 \u0432 <a href=\"http:\/\/pear.php.net\/package\/html_safe\/\">PEAR::HTML_Safe<\/a> ), \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u043e\u043c\u043e\u0433 \u0440\u0430\u0441\u0447\u0438\u0441\u0442\u0438\u0442\u044c \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u043d\u044b\u0439 \u0445\u043b\u0430\u043c \u0438 \u0432\u044b\u0434\u0430\u043b \u043c\u043d\u0435 xhtml. \u041d\u0443 \u0430 \u0434\u0430\u043b\u0435\u0435 <a href=\"http:\/\/php.net\/manual\/en\/function.dom-domdocument-loadhtml.php\">DOMDocument::loadHTML<\/a>. \u041d\u043e \u0451\u043b\u043a\u0438-\u043f\u0430\u043b\u043a\u0438\u2026 \u0440\u0443\u0433\u0430\u0435\u0442\u0441\u044f \u043d\u0430 nobr \u0435\u0449\u0451 \u043d\u0430 \u0447\u0442\u043e-\u0442\u043e\u2026 \u043d\u043e \u0434\u0435\u0440\u0435\u0432\u043e \u0432\u044b\u0434\u0430\u0451\u0442. \u041f\u043e\u0441\u0442\u0430\u0432\u0438\u0442\u044c <a href=\"http:\/\/php.net\/manual\/en\/language.operators.errorcontrol.php\">\u0441\u043e\u0431@\u043a\u0443<\/a> ? <a href=\"http:\/\/miracle.rpz.name\/2006\/02\/24\/\">\u043d\u0443 \u0443\u0436 \u043d\u0435\u0442<\/a>\u2026 SafeHTML \u0438\u043c\u0435\u0435\u0442 \u0432 \u0441\u0432\u043e\u0439\u0441\u0442\u0432\u0430\u0445 \u043c\u0430\u0441\u0441\u0438\u0432 $deleteTags, \u0442\u0443\u0434\u0430 \u0438 \u0434\u043e\u0431\u0430\u0432\u0438\u043b nobr \u0438 \u0435\u0449\u0451 \u043f\u0430\u0440\u043e\u0447\u043a\u0443 \u0441\u043e\u0432\u0441\u0435\u043c \u043d\u0435\u043d\u0443\u0436\u043d\u044b\u0445 \u043c\u043d\u0435 \u0442\u0435\u0433\u043e\u0432 (img \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440). \u0418 \u0442\u0430\u043a \u0443 \u043c\u0435\u043d\u044f \u0435\u0441\u0442\u044c dom-\u0434\u0435\u0440\u0435\u0432\u043e, \u0443 \u043c\u0435\u043d\u044f \u0435\u0441\u0442\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u044f <a href=\"http:\/\/php.net\/simplexml_import_dom\">simplexml_import_dom<\/a> \u0438 \u0435\u0441\u0442\u044c \u0447\u0451\u0442\u043a\u0430\u044f \u0443\u0432\u0435\u0440\u0435\u043d\u043d\u043e\u0441\u0442\u044c \u0432 \u0442\u043e\u043c \u0447\u0442\u043e \u0432 \u0442\u0440\u0435\u0442\u044c\u0435\u0439 \u0442\u0430\u0431\u043b\u0438\u0446\u0435, \u0432\u043e \u0432\u0441\u0435\u0445 \u0440\u044f\u0434\u0430\u0445 \u043d\u0430\u0447\u0438\u043d\u0430\u044f \u0441 \u0442\u0440\u0435\u0442\u044c\u0435\u0433\u043e, \u0432\u043e \u0432\u0442\u043e\u0440\u043e\u0439 \u044f\u0447\u0435\u0439\u043a\u0435 \u0435\u0441\u0442\u044c \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u044b\u0435 \u043c\u043d\u0435 \u0434\u0430\u043d\u043d\u044b\u0435, \u043d\u043e \u043e\u043d\u0438 \u044f\u0432\u043b\u044f\u044e\u0442\u0441\u044f \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u044b\u043c\u0438 \u0435\u0441\u043b\u0438 \u0441\u0440\u0435\u0434\u0438 \u0442\u0435\u043a\u0441\u0442\u0430 \u044d\u0442\u043e\u0439 \u044f\u0447\u0435\u0439\u043a\u0438 \u0435\u0441\u0442\u044c \u043a\u043b\u044e\u0447\u0435\u0432\u043e\u0435 \u0441\u043b\u043e\u0432\u043e (\u043f\u0443\u0441\u0442\u044c \u044d\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \"keyword\"). \u042f \u043a\u043e\u043d\u0435\u0447\u043d\u043e \"\u043d\u0435 \u0431\u043e\u044e\u0441\u044c\" \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u043d\u044b\u0445 \u0432\u044b\u0440\u0430\u0436\u0435\u043d\u0438\u0439, \u043d\u043e \u043d\u0435 \u043d\u0430\u0441\u0442\u043e\u043b\u044c\u043a\u043e \u0445\u043e\u0440\u043e\u0448\u043e \u0438\u0445 \u0437\u043d\u0430\u044e \u0447\u0442\u043e\u0431\u044b \u043d\u0430\u043f\u0438\u0441\u0430\u0442\u044c \u043d\u0443\u0436\u043d\u043e\u0435 \u043c\u043d\u0435. \u0410 \u0432\u043e\u0442 xpath \u0442\u0443\u0442 \u043a\u0430\u043a \u043d\u0435\u043b\u044c\u0437\u044f \u043a\u0441\u0442\u0430\u0442\u0438 :<br \/><blockquote> $xpath = \"\/\/table[position() = 3]\/\/tr[position() &gt;=3]\/\/td[position() = 2 and contains(text(),\"keyword\")]\/text()\";<\/blockquote><br \/>&nbsp; \u041f\u043e\u0441\u043b\u0435 \u0432\u044b\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u044f $simplexml-&gt;xpath($xpath); \u044f \u043f\u043e\u043b\u0443\u0447\u0430\u044e \u043c\u0430\u0441\u0441\u0438\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0441\u043e\u0434\u0435\u0440\u0436\u0438\u0442 \u0442\u0435\u043a\u0441\u0442 \u0438\u0437 \u0438\u0441\u043a\u043e\u043c\u044b\u0445 \u044f\u0447\u0435\u0435\u043a.<br \/><br \/><p>&nbsp; \u0418\u0442\u043e\u0433\u043e: \u0438\u0437\u0431\u0430\u0432\u0438\u043b \u0442\u043e\u0432\u0430\u0440\u0438\u0449\u0435\u0439 \u043e\u0442 \u0434\u043e\u043b\u0433\u043e\u0439 \u0438 \u043d\u0443\u0434\u043d\u043e\u0439,\u0440\u0443\u0447\u043d\u043e\u0439 \u043f\u043e\u0434\u0433\u043e\u0442\u043e\u0432\u043a\u0438 \u0434\u0430\u043d\u043d\u044b\u0445, \u0435\u0449\u0451 \u0440\u0430\u0437 \u0443\u0431\u0435\u0434\u0438\u043b\u0441\u044f \u0447\u0442\u043e xpath \u044d\u0442\u043e <strike>\u0432\u0430\u043c \u043d\u0435 \u043f\u0440\u044f\u043d\u0438\u043a\u0438 \u043d\u0430 \u043a\u043b\u0430\u0434\u0431\u0438\u0449\u0435 \u0442\u044b\u0440\u0438\u0442\u044c<\/strike> \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0441\u0442\u0440\u0430\u0448\u043d\u0430\u044f \u0430\u0431\u0440\u0435\u0432\u0438\u0430\u0442\u0443\u0440\u0430, \u043d\u043e \u043f\u043e\u043b\u0435\u0437\u043d\u0430\u044f \u0448\u0442\u0443\u043a\u0430\u2026<\/p><p>P.S. <br \/>&nbsp;\u042f \u043d\u0438 \u0432 \u043a\u043e\u0435\u043c \u0441\u043b\u0443\u0447\u0430\u0435 \u043d\u0435 \u043f\u0440\u0435\u0434\u043b\u0430\u0433\u0430\u044e \u043f\u043e\u0432\u0441\u0435\u043c\u0435\u0441\u0442\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u0442\u044c \u043f\u043e\u0434\u043e\u0431\u043d\u0443\u044e \u0442\u0435\u0445\u043d\u0438\u043a\u0443 (\u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0435 dom-\u0434\u0435\u0440\u0435\u0432\u0430 \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u044f \u043e\u0447\u0435\u043d\u044c \"\u043f\u0430\u043c\u044f\u0442\u0435\u0451\u043c\u043a\u0430\u044f\", xpath <strike>\u0432\u0435\u0440\u043e\u044f\u0442\u043d\u0435\u0435 \u0432\u0441\u0435\u0433\u043e<\/strike> \u0442\u043e\u0436\u0435), \u043d\u043e \u0432 \u0440\u044f\u0434\u0435 \u0441\u043b\u0443\u0447\u0430\u0435\u0432 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0442\u0430\u043a\u043e\u0439 \u043c\u0435\u0442\u043e\u0434 \u043f\u0440\u043e\u0449\u0435 \u0438 \u043f\u043e\u043d\u044f\u0442\u043d\u0435\u0435 \u0438\u043d\u044b\u0445 \u043c\u0435\u0442\u043e\u0434\u043e\u0432\u2026<\/p><p>\u0418 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u0435 \u043f\u043e\u0441\u0442\u0430 \"\u0434\u0443\u0440\u0430\u0446\u043a\u043e\u0435\", \u043d\u043e \u043d\u0430 \u0434\u0440\u0443\u0433\u043e\u0435 \u043d\u0435 \u0445\u0432\u0430\u0442\u0430\u0435\u0442 \u0431\u0443\u0439\u043d\u043e\u0441\u0442\u0438 \u0444\u0430\u043d\u0442\u0430\u0437\u0438\u0438...<br \/><\/p><br \/><br \/>Technorati Tags: <a href=\"http:\/\/technorati.com\/tag\/dev\" rel=\"tag\">dev<\/a>, <a href=\"http:\/\/technorati.com\/tag\/web\" rel=\"tag\">web<\/a>, <a href=\"http:\/\/technorati.com\/tag\/php\" rel=\"tag\">php<\/a>, <a href=\"http:\/\/technorati.com\/tag\/xpath\" rel=\"tag\">xpath<\/a>, <a href=\"http:\/\/technorati.com\/tag\/simplexml\" rel=\"tag\">simplexml<\/a>","type":"rich"}