Web Scrapping with Python, PHP, Javascript
세가지 언어로 동일한 기능을 수행해 봄으로서 세 언어의 특징과 장단점을 살펴볼 수 있을것 같다.
간단한 Web Scrapping 코드를 각 언어로 구현하면 아래와 같다.
[Python]
from lxml import html
page = "<html><body><ul><li>First Item</li><li>Second Item</li></ul></body></html>"
tree = html.fromstring(page)
items = tree.xpath('//li/text()')
[PHP]
$page = "<html><body><ul><li>First Item</li><li>Second Item</li></ul></body></html>";
$doc = new DOMDocument();
$doc -> loadHtml($page);
$xpath = new DOMXPath($doc);
$items = $xpath -> query('//li/text()');
[Javascript]
var xpath = require('xpath');
var dom = require('xmldom').DOMParser;
var page = "<html><body><ul><li>First Item</li><li>Second Item</li></ul></body></html>";
var doc = new don().parseFromString(page);
var items = xpath.select('//li/text()', doc);
결론적으로,
- Python 이 역시 Web Scrapping 에는 최적화 되어있는것으로 보인다. 문법역시 깔끔하다.
- PHP 는 가장 많이 사용되는 서버 언어이긴 하지만, 상당히 번거롭다.
- Javascript 는 일단, Javascript 자체로 먹고 들어가는 부분이 있다.
역시..Python 인가..ㅋㅋ