Фемида
11.10.2024 Техно

Как найти данные на сайтах судов с помощью парсера

Фото
Shutterstock

В начале года перестал работать официальный российский агрегатор судебных дел ГАС «Правосудие». С его помощью исследователи, юристы и журналисты изучали массивы дел по гражданским, уголовным и административным статьям, а также могли получить другую полезную информацию — например, какими приложениями пользуются мошенники. Однако есть инструмент,  позволяющий быстро собрать информацию по различным судам в стране и без названного ресурса – это парсер. О том, что это такое и как работает рассказывает спецкор издания-иноагента The Bell Ирина Панкратова в своей рубрике  «Онлайн-расследование».

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+

Инструмент — парсер «Если быть точным»

Парсер проекта «Если быть точным» собирает 82% уголовных дел, рассмотренных в первой инстанции районными, областными и гарнизонными судами в 2012–2014 годах, и 85–95% дел, рассмотренных в 2015–2023 годах. В случае с делами об административных правонарушениях речь идет о 70–80% дел.

Суды часто меняют свои сайты, например, переходят на другие шаблоны карточек судебных дел или добавляют капчу. За лето, по расчетам «Если быть точным», больше 800 районных судов внесли такие изменения. Все они учтены в последней версии парсера.

Эта версия парсера собирает информацию по делам первой и апелляционной инстанций, рассмотренным в районных, гарнизонных, областных, окружных, а также апелляционных и кассационных судах. Доступны пять типов судебного производства:

  • уголовное
  • административное
  • гражданское
  • об административных правонарушениях
  • и производство по материалам

Нужно учитывать, что при использовании парсера для сбора данных по конкретной статье дела, рассмотренные мировыми судами, не попадают в выгрузку.

Как запустить парсер:

— Парсер использует драйвер FireFox, поэтому у вас на устройстве должен быть установлен браузер Mozilla Firefox — здесь его можно скачать.

— Если при запуске парсера вы увидите сообщения об ошибках, связанных с WebDriver, попробуйте скачать драйвер для вашей операционной системы и заменить драйвер (файл geckodriver.exe) в папке ./src/main/resources/<имя вашей операционной системы>/. Удалите старый файл geckodriver.exe и разместите в папке вместо него новый.

— Последняя версия парсера доступна в отдельном репозитории Github «Если быть точным». Чтобы скачать парсер, перейдите на страницу с релизами, найдите последнюю версию (на момент публикации этой инструкции это sudrfscraper-v0.3.0.2) и скачайте архив, название которого соответствует вашей операционной системе (linux, macOs или Windows). Если у вас Windows, то парсер можно запустить, дважды кликнув на файл run.bat. Если у вас Linux или MacOS, то не обойтись без работы с командной строкой: введите полный путь до файла run.sh (/path/to/run.sh) и нажмите Enter.

— Если парсер был запущен без ошибок, то у вас откроется браузер Firefox Mozilla с интерактивным интерфейсом. На этой странице в левом верхнем углу вы можете выбрать язык интерфейса (русский или английский), прочитать краткое описание возможностей парсера и перейти к формированию запроса, нажав кнопку «Продолжить» (Continue).

Подробная инструкция по установке парсера — здесь.

Какая информация о судебных делах доступна

На сайтах районных и областных судов информация по каждому делу публикуется в формате специальных карточек. Обычно в них есть несколько вкладок:

— «Дело»: основная информация, включая номер дела, даты поступления и рассмотрения, ФИО судьи, краткий результат рассмотрения дела.

— «Движение дела»: этапы и даты рассмотрения дела от поступления в суд до вынесения решения.

— «Лица»: ФИО участников судебного дела, в первую очередь — обвиняемого, а также адвокатов, прокуроров и др.

— «Судебные акты»: текст решения, вынесенного судом.

Суды не всегда заполняют все поля карточки дела. Например, тексты судебных решений по статье 105 «Убийство» Уголовного кодекса публикуются примерно в 60% случаев.

Парсер «Если быть точным» находит карточки судебных дел по заданным критериям и выгружает информацию в удобный для работы формат таблицы. Название суда, даты поступления дела и его рассмотрения, идентификатор дела, ФИО судьи и обвиняемого, состав преступления и текст судебного решения, если он был опубликован, — все эти данные доступны по результатам парсинга.

Примеры использования

Проект «Если быть точным» рассказывал о том, как пол подсудимых влияет на решение судей — женщины, как правило, получают более мягкие наказания. Благодаря анализу судебных решений, которые парсер тоже собирает, можно предположить, что это связано с тем, что в четырех из пяти случаев женщины, совершившие убийство, защищаются от домашнего насилия.

В некоторых случаях судебные данные могут стать альтернативой недоступной статистике. Так, в начале 2023 года Генпрокуратура перестала обновлять портал правовой статистики, где выкладывались подробные данные о преступности в российских регионах. Теперь косвенно оценить, что происходит с преступностью в России, можно с помощью судебных данных, в том числе тех, что собирает парсер.

Что мне с этого?

Сбор судебных данных помогает исследователям понять, как работает российская судебная система. При подготовке к судебным слушаниям стороны, как правило, тоже изучают судебную практику (вынесенные решения и аргументацию судей) по похожим делам. Хотя чаще всего юристы пользуются специальными коммерческими сервисами, парсер «Если быть точным» тоже позволяет сформировать подборку дел с нужными параметрами.

Авторизуйтесь, чтобы оставлять комментарии