HTML 파서 – 4.배열 구조의 구성

다차원 배열 구조 앞 장의 예제에서 보았듯이 파서 배열 구조는 다차원 배열(multi-dimensional array)로 구성되어 있습니다. 배열 구조를 보기 위해 사용하였던 var_dump() 함수 대신에 다차원배열 상태 그대로 보게 되면 아래와 같습니다.…

Continue ReadingHTML 파서 – 4.배열 구조의 구성

HTML 파서 – 3.배열 구조를 보여주는 예제

배열구조를 보여주는 예제 HTML 문서 우선 아래와 같은 HTML 문서(파일명:sample.html)가 있다고 하지요. HTML 문서를 분석하는 예제 아래는 위에 있는 HTML 문서를 이 함수에 의해 분석하여 생성된 배열구조를 보여주는 예제(파일명:test.php)입니다. 예제…

Continue ReadingHTML 파서 – 3.배열 구조를 보여주는 예제

HTML 파서 – 2.파서 관련 함수

제공되는 함수 현재는 xml 파서 함수 중 xml_parse_into_struct 함수를 모델링한 html_parse_into_struct 함수만 제공됩니다. 함수 버전 기능 클래스명 html_parse_into_struct 0.0.1 HTML 데이터를 배열 구조로 분석 HtmlParser int html_parse_into_struct (string data, array…

Continue ReadingHTML 파서 – 2.파서 관련 함수

HTML 파서 – 1.개요

HTML 규약에 의해 작성된 문서를 분석하는 함수입니다. 0.0.1p2에서는 아래의 예와 같이 0.0.1p1에서 속성값에 인용부호가 나타날 때 생기는 문제점을 일부 해결하기 위해 약간 수정하였습니다. 위와 같이 바깥쪽 인용부호를 생략한 채 xxx@xxxxx.com을…

Continue ReadingHTML 파서 – 1.개요