Ник | Пост | Дата |
---|---|---|
tango | There is a web form on a Kazakhstan government website that lets you submit a URL to be blocked, or query the list of blocked URLs. Пожаловаться на интернет контент (archive) When you enter a query in the search box, it makes a backend HTTP request like https://www.gov.kz/banned_sites?url=torproject.org. The response is a JSON array:
You search for a string as short as 1 letter, and apparently, the response contains all records that have that letter anywhere. For example, https://www.gov.kz/banned_sites?url=j yields 13,444 records that have the letter ‘j’. Some letters result in a 500 HTTP status error—maybe there are too many results for those letters. I did queries for many single letters and combined and archived them: https://archive.org/details/www_gov_kz_banned_sites_20250317 | 2025-03-17T14:51:37.791Z |
Nina(Nina) | Переведу: На правительственном сайте Казахстана есть веб-форма, с помощью которой можно отправить URL-адрес на блокировку или запросить список заблокированных сайтов. Пожаловаться на интернет-контент (archive) Когда вы вводите запрос в поисковое поле, выполняется HTTP-запрос к бэкенду, например: Ответ приходит в виде JSON-массива:
Можно искать строки длиной от 1 буквы, и, судя по всему, ответ содержит все записи, где встречается эта буква. Я сделал запросы для многих отдельных букв, объединил и сохранил архив здесь: Файл 2025-03-17/dedup.jsonl очищен от дубликатов и содержит 102 644 записи, занимает 38 МБ. | 2025-03-18T13:13:00.899Z |