NTA

@newtechaudit


О цифровых технологиях аудита
👉 newtechaudit.ru/
👉 habr.com/ru/users/newtechaudit

👨‍💻 Обратная связь: @NTAfeedback_bot

NTA

20 Jan, 18:44


Иногда очень хочется, чтобы искусственный интеллект вычитывал текст на грамматические ошибки за тебя. В посте разбираемся, как это возможно с новым инструментом. https://newtechaudit.ru/nlp-dlya-poiska-grammaticheskih-oshibok/

NTA

20 Jan, 18:07


Думаешь о начале своей карьеры в IT? Хочешь работать с большими данными? Может, это знак? Переходи в hh (https://hh.ru/vacancy/93426863) и откликайся на вакансию! Ищем в нашу команду начинающих Data Analysts, Data Scientists и Data Engineers.

NTA

20 Jan, 18:06


Для тренировки нейронных сетей необходимы датасеты с достаточным количеством тренировочных данных. Зачастую в рамках разработки ML‑модели, именно составление датасета, пригодного для её обучения, занимает большую часть времени и усилий. В случае, если датасет нельзя составить из реальных данных, прибегают к генерации синтетических данных https://newtechaudit.ru/generacziya-pasportnyh-dannyh-dlya-obucheniya-modelej/

NTA

20 Jan, 18:03


Одной из областей применения ИИ сегодня является автоматизация контроля за сотрудниками. В данном посте мы рассмотрим приложение технологий ML к задаче детектирования спящих людей по видеозаписям камер наблюдения https://newtechaudit.ru/ya-znayu-chto-ty-delal-etoj-nochyu/

NTA

20 Jan, 17:55


Данные занимают центральное место в информационном обществе. Именно информация является основой для принятия решений, развития бизнеса и научных исследований. Многие организации инвестируют огромные средства в системы, способные хранить, обрабатывать и анализировать данные. https://newtechaudit.ru/llmy-v-preobrazovanii-zaprosa-na-estestvennom-yazyke-v-sql-text2sql/

NTA

20 Jan, 17:53


Обучение с подкреплением (reinforcement learning, RL) является разделом машинного обучения, активно развивающимся направлением в искусственном интеллекте. В данном посте я хочу показать, как с помощью нехитрого трюка ускорить обучение алгоритма RL, на примере окружения игры в Gym. https://newtechaudit.ru/uskoryaem-obuchenie-s-podkrepleniem-na-50/

NTA

20 Jan, 17:45


С ростом технологий растет и спрос на безопасность приложений. Найти уязвимости в ведущих социальных сетях, мессенджерах становится все труднее. Крупные компании стараются заботиться о своих данных, о данных пользователей, ведь утечка информации может сильно сказаться на репутации компании. Для безопасности все чаще применяют шифрование разных видов: двухфакторную авторизацию, сложные пароли, привязку к мобильному телефону и т.д. Но что насчет API? Безусловно, без этой технологии трудно представить современное приложение однако некоторые разработчики дают слишком много возможностей и прав своему API, а именно access_token. Об этом сегодня и поговорим. https://newtechaudit.ru/chitaj-apisanie/

NTA

20 Jan, 17:42


В данной публикации я расскажу о личном опыте взаимодействия с ResourceManager REST API и возможностях взаимодействия с приложениями через него. https://newtechaudit.ru/vladelecz-podzemelya-ili-avtomatizacziya-administrirovaniya-hadoop-klastera/

NTA

20 Jan, 17:35


При валидации моделей классификации иногда используется такой показатель, как «доверительный интервал коэффициента Джини». По отдельности термины «доверительный интервал» и коэффициент Джини известны и понятны. Но их сочетание может вызвать вопросы даже у специалиста, знакомого со статисткой. https://newtechaudit.ru/gini-coefficient/

NTA

20 Jan, 17:32


Поделюсь опытом использования больших языковых моделей (LLM) для создания персонажей с Python и моделей OpenAI и Sber. https://newtechaudit.ru/personazh-python-llm-gpt-kandinsky/

NTA

20 Jan, 17:15


В наше время остро стоит вопрос обработки больших данных, за все годы развития компьютерной инфраструктуры было накоплено и продолжает накапливаться огромное количество различных данных и старые методы их интерпретации уже не могут считаться оптимальными.
В моей работе я часто сталкиваюсь с необходимостью загрузки, трансформации, интерпретации различных данных и в этом посте я расскажу об использованном мной инструменте - фреймворке .NET for Apache Spark https://newtechaudit.ru/obrabotka-bolshih-dannyh-pri-pomoshhi-biblioteki-net-for-apache-spark/

NTA

20 Jan, 17:12


В этом посте предлагаю обсудить важность качества кода, разобрать принцип работы библиотек, которые призваны помочь улучшить читаемость кода, упростить работу с ним и автоматизировать этот процесс https://newtechaudit.ru/avtomaticheskoe-formatirovanie-proektov-na-python-s-ispolzovaniem-autopep8/

NTA

20 Jan, 17:05


Как прочитать файл Excel, если он напоминает монстра Франкенштейна? Как склеить множество таких файлов в единый датасет и обработать их, не потеряв ни одной ячейки? Это и многое другое, включая подробности разработки нового инструмента — найдёте в посте. https://newtechaudit.ru/python-i-excel-prochitat-i-ne-poteryat/

NTA

20 Jan, 17:02


Это первый пост в серии, где я буду рассказывать, как создавал свой собственный task manager. В настоящее время используются различные инструменты для управления задачами, от электронной почты и Excel‑таблиц до специальных программ. Первый подход — письма и таблички, затрудняет отслеживание статуса задач, распределение ресурсов и общую координацию работ. Второй — готовое решение, имеет как плюсы, так и минусы. Подробно сильные и слабые стороны доступных на рынке task‑менеджеров разобраны тут. https://newtechaudit.ru/razrabotka-task-manager-pri-pomoshhi-bibliotek-flask-i-psycopg2/

NTA

20 Jan, 16:55


Аудит является неотъемлемой частью бизнес-практики, обеспечивая независимую оценку финансовой отчетности и процессов в организации. Аудиторы полагаются на опыт и статистическую выборку для ручной проверки сотен документов и свидетель-ств, определения сильных сторон и углубленного анализа организационных процедур и транзакций. Однако этот ручной процесс превратил аудит в трудоемкую и ресурсоемкую деятельность. https://newtechaudit.ru/ispolzovanie-tehnologij-mashinnogo-obucheniya-v-audite-primery-effektivnogo-primeneniya/

NTA

20 Jan, 16:52


В данном посте я разберу задачу причинно-следственного (Causal Inference) и затрону отдельные аспекты её решения с помощью ациклических направленных графов с использованием инструментов языка программирования R, не погружаясь в сложную математическую терминологию. https://newtechaudit.ru/zadacha-prichinno-sledstvennogo-vyvoda-i-acziklicheskie-napravlennye-grafy-v-r/

NTA

20 Jan, 16:45


В современном мире, где фотографии играют огромную роль в сфере социальных медиа, онлайн-безопасности и контроля содержимого, важно иметь эффективные инструменты для обнаружения нежелательных предметов на изображениях. В данной публикации мы рассмотрим практическое применение двух из самых популярных моделей YOLO и ResNet для обнаружения нежелательных предметов на фотографиях. https://newtechaudit.ru/prakticheskoe-primenenie-modelej-yolo-i-resnet-dlya-obnaruzheniya-nezhelatelnyh-predmetov-na-fotografiyah/

NTA

20 Jan, 16:42


В апреле 2023 года была опубликована уязвимость CVE-2023-32784 KeePass, позволяющая злоумышленнику получить данные мастер-пароля к базе .kdbx путём чтения дампов памяти системы. По версии автора, уязвимость связана со способом обработки данных в памяти фреймвoрка .NET.
В списке изменений релиза 2.54 от 03.06.2023 указано устранение данного эксплойта. Попробую воспроизвести на предыдущей версии, а заодно и проверю «работу над ошибками» автора. https://newtechaudit.ru/vzlom-master-parolya-keepass/

NTA

20 Jan, 16:35


В настоящее время оснащенность средствами связи высока, однако в мире и сейчас существует немало мест, где людям эти средства были недоступны. Есть множество областей, где уровень сигнала критически низок или и вовсе отсутствует возможность связаться с миром. Понятна потеря связи на высочайших пиках горных вершин или под водной толщей океана, и даже в сделанных из металла лифтах в многоэтажных зданиях. Однако проблемы со связью возникающие в густонаселенных регионах России, а тем более в пределах городов-миллионников могут, а главное, должны быть устранены. Основная цель этого поста – разобрать весь алгоритм и набор Python-скриптов поиска проблемных зон связи по координатам, где была зафиксирована потеря связи. https://newtechaudit.ru/poisk-problemnyh-zon-svyazi-po-koordinatam/

NTA

20 Jan, 16:32


Рассмотрю кейс поиска «близнецов» в паспортных данных, которые были размещены в pdf-файлах, насчитывающих десятки, а порой и сотни страниц https://newtechaudit.ru/ispolzovanie-insightface-dlya-bystrogo-poiska-i-sravneniya-licz-na-izobrazheniyah/