Ник Пост Дата
tango

There is a web form on a Kazakhstan government website that lets you submit a URL to be blocked, or query the list of blocked URLs.

Пожаловаться на интернет контент (archive)

When you enter a query in the search box, it makes a backend HTTP request like https://www.gov.kz/banned_sites?url=torproject.org. The response is a JSON array:

[
  {
    "id": "3771",
    "name": "torproject.org",
    "urladdress": "https://www.torproject.org/ru/download",
    "categoryname": "Нарушение норм Закона РК «О связи» (анонимайзеры, прокси-серверы типа TOR, VPN-серверы и др.)",
    "courtname": "",
    "courtdate": "27.11.2024",
    "documenttypename": "Предписание УО",
    "regdate": "",
    "regnumber": "",
    "courtnumber": " 26-04-26/5175",
    "blockdate": null,
    "ipaddress": null
  }
]

You search for a string as short as 1 letter, and apparently, the response contains all records that have that letter anywhere. For example, https://www.gov.kz/banned_sites?url=j yields 13,444 records that have the letter ‘j’. Some letters result in a 500 HTTP status error—maybe there are too many results for those letters.

I did queries for many single letters and combined and archived them:

https://archive.org/details/www_gov_kz_banned_sites_20250317
2025-03-17/dedup.jsonl is a deduplicated list, 102,644 records and 38 MB

2025-03-17T14:51:37.791Z
Nina(Nina)

Переведу:

На правительственном сайте Казахстана есть веб-форма, с помощью которой можно отправить URL-адрес на блокировку или запросить список заблокированных сайтов.

Пожаловаться на интернет-контент (archive)

Когда вы вводите запрос в поисковое поле, выполняется HTTP-запрос к бэкенду, например:
:point_right: https://www.gov.kz/banned_sites?url=torproject.org

Ответ приходит в виде JSON-массива:

[
  {
    "id": "3771",
    "name": "torproject.org",
    "urladdress": "https://www.torproject.org/ru/download",
    "categoryname": "Нарушение норм Закона РК «О связи» (анонимайзеры, прокси-серверы типа TOR, VPN-серверы и др.)",
    "courtname": "",
    "courtdate": "27.11.2024",
    "documenttypename": "Предписание УО",
    "regdate": "",
    "regnumber": "",
    "courtnumber": "26-04-26/5175",
    "blockdate": null,
    "ipaddress": null
  }
]

Можно искать строки длиной от 1 буквы, и, судя по всему, ответ содержит все записи, где встречается эта буква.
Например, https://www.gov.kz/banned_sites?url=j возвращает 13 444 записи, содержащие букву “j”.
Некоторые запросы приводят к ошибке 500 — вероятно, из-за слишком большого количества результатов для этой буквы.

Я сделал запросы для многих отдельных букв, объединил и сохранил архив здесь:

Файл 2025-03-17/dedup.jsonl очищен от дубликатов и содержит 102 644 записи, занимает 38 МБ.

2025-03-18T13:13:00.899Z