суббота, 2 июля 2011 г.

Получение и анализ файла sitemap.xml на Delphi.

Когда возник вопрос о скачке карты сайта (файла sitemap.xml) с любого ресурса и дальнейшим анализом его структуры при помощи встроенных средств Delphi первое что пришло в голову это вопрос работы с xml файлами, этот вопрос и был изучен детально как и детальная документация по структуре объекта. Сама программка была написана довольно быстро однако никак не хотела вычитывать данные с файла так как мне нужно. На разнообразных форумах я так ничего и не нашел кроме прописных истин, а по работе конкретно с файлами sitemap информации вообще почти нету, кроме работы Synapse+NativeXML, что меня не устраивало хотя сам алгоритм и принципы уже были понятны четко. Исключительно случайно был найден кусочек кода который считывает информацию из xml файла и строит дерево данных.
Я не привожу здесь анализатор данных т.к. он был написан для своих нужд и вряд ли еще кому нибудь пригодится, а только сам принцип работы касающийся конкретно работы с файлами sitemap.xml, а именно, считать с сайта данные из файла карты сайта и получить полный список url-ов, возможно кому нибудь понадобится и существенно сократит затраты времени на написание полезного софта. Скачать архив с исходником.