Лінейная (аг | рэг) рэсія (@linearaggression) Kanalının Son Gönderileri

Лінейная (аг | рэг) рэсія Telegram Gönderileri

Лінейная (аг | рэг) рэсія
Пра даныя і як іх прыстасаваць да штодзённасці

Мяне можна знайсці

У твітары: https://twitter.com/aliaksandr_k
Англ: https://twitter.com/unfriendlydata
Ці ў тг: @shurackapalieski
1,245 Abone
86 Fotoğraf
3 Video
Son Güncelleme 10.03.2025 04:09

Лінейная (аг | рэг) рэсія tarafından Telegram'da paylaşılan en son içerikler

Лінейная (аг | рэг) рэсія

14 Feb, 10:10

654

Пра эгалітарны беларускі фэйсбук

Знайшоў забаўны датасэт пра "Cross-Gender Friending Ratio". Індэкс роўны 1 значыць, што ў краіне і мужчыны і жанчыны ў сярэднім маюць аднолькавы % жанчын у сябрах. Менш аднаго -- у жанчын у сябрах большы % жанчын. Чым бліжэй да нуля тым больш гэты гендерны разрыў

Беларусь на мапе ёсць анамаліяй і падобная размеркаваннем больш на Германію, чым на суседзяў. Падазраю праз тое, што ФБ сацсетка ў РБ непапулярная і аўдыторыя там спецыфічная адносна ўсяго насельніцтва
Лінейная (аг | рэг) рэсія

04 Feb, 10:07

1,042

Lanced Digit Health апублікаваў вынікі маштабнага клінічнага даследавання пра AI і анкалогію — на 100.000 удзельніц

Для адной групы выкарыстоўвалі AI-асістэнт пры мамаграфіі, для другой карысталася стандартнымі метадамі

Вынікі? На 28% больш выяўленых выпадкаў рака без істотнага росту false positives ("анкалогіі няма але дыягнастуем"). У лічбах гэта 6.4 дыягнаставаных выпадкі на 1000 шведак супраць 5.0 у кантрольнай групе.

На фоне slop навін пра чарговы чат-бот, грэе мне душу
Лінейная (аг | рэг) рэсія

02 Oct, 17:21

1,710

Сумавалі? Будзе жыццесцвярджальны, восеньскі пост. Пра карцінкі

Спачатку мне было лянота пісаць пра падробку даных у даследаванні пра Альцгеймер. Адна з уплывовых папер у галіне, 2006 году, пра т.з. Aβ*56, з высокай імавернасцю ўтрымлівае выдуманыя даныя

Потым было лянота пісаць пра падробку даных у даследаваннях па Альцгеймеры і Паркінсоне. Адным з найбольш цытуймых навукоўцаў на планеце. Падазраюць 132 даследаванні з 1997 па 2023. Гадавы бюджэт ягонага дэпартаменту — 2.6 мільярды

Потым пабачыў навіну пра тое, што Нобелеўскі лаўрэат 2019 году, які вывучаў Альцгеймер шмат чаго, у тым ліку ракавыя хваробы, таксама фальсіфікаваў даныя. Адкліканыя ўжо 13 ягоных даследаванняў, апошняе з часопісу Cancer Research

Ну і вырашыў, што час вас парадаваць. Ведаеце, што забаўнае? Яны трапіліся праз +/- адное і тое ж — копіпасцілі адныя і тыя ж выявы з розных папер пра розныя эксперыменты, падганяючы іх мінімальна пад патрэбныя высновы. Па-просту, пацанам было лянота кожны раз выдумляць новыя фэйкавыя даныя

Гідрыруйцеся і не хварэйце
Лінейная (аг | рэг) рэсія

08 Jul, 08:16

2,066

У маю скарбонку візуалізацый. Гэтым разам France 24

Гляньце на памер правага сегменту адносна памеру левых. І на лічбы
Лінейная (аг | рэг) рэсія

30 Jun, 15:05

2,155

Цікавае пра грошы і бяздомных

У Дэнверы адной групе бяздомных год выплочвалі 1.000$ у месяц, другой — адной сумай накінулі 6.500$ са старту і кожны месяц выплочвалі па 500$ дадатковых

Кантрольнай групе выплочвалі па 50$ у месяц. Думаю, вырашылі што хоць нейкая сума патрэбная, каб яны не разбегліся за год эксперыменту — потым не знойдзеш і даныя не збярэш

Усе 806 чалавек без ментальных захворванняў

Праз год ~60% з першай групы знайшлі жытло, ~60% з другой і ў трэцяй групе таксама ~60% знайшлі сабе жытло

З аднаго боку, я глянуў мясцовы арэндны рынак і там толькі 16% прапаноў ніжэй 1000$/месяц. Ну і "я ўдзельнічаю ў даследаванні" не самая пераканаўчая крыніца заробку для лэндлордаў. З іншага боку, 12 штук — гэта даволі шмат, я б чакаў хоць нейкага пазітыўнага эфекту
Лінейная (аг | рэг) рэсія

26 May, 07:54

2,336

Добрай раніцы. Распавяду смешнае

За апошні пару тыдняў было апублікавана тры гучныя мета-аналізы: пра лячэнне дэпрэсіі грыбамі, пра эксперыменты з трывожным разладам і лячэнне дэпрэсіі карыпразінам

Што аб’ядноўвае гэтыя даследаванні? Яны ўсе зрабілі адную і тую ж статыстычную памылку: пераблыталі стандартную памылку са стандрартнай дэвіяцыяй. Што гэта значыць распавядаць не буду, гэта нудна. Але распавяду, да чаго гэта прывяло

А прывяло гэта да таго, што эфекты, якія яны знайшлі, была ў разы завышаныя: у паперы пра эфектыўнасць грыбоў на ~500%, у паперы пра турботу на ~300% і ў паперы пра дэпрэсію і карыпразін на ~2000%

Яшчэ раз: за ~2 тыдні выходзіць 3 даследаванні з элементарнай статыстычнай памылкай, якія прапускаюць і аўтары і рэв’юверы, але якія за пару дзён знаходзяць у твітары (тут ці тут)

Так і жывем
Лінейная (аг | рэг) рэсія

15 May, 12:49

1,743

Люблю патэрны ў даных пра якія нічога не ведаю. Трэніруе інтуіцыю

Напрыклад колькасць серыйных забойцаў у ЗША. У 80-ыя быў 7-14разовы ўсплёск, адносна 1950-ых ці 2010-ых

Чаму так у мяне не было ідэй, таму сабраў гіпотэзы ад людзей, якія у гэтым разбіраюцца:

Пра рост:
1. Будаўніцтва аўтамагістраляў спросціла перасоўванне і зрабіла скаладней звязаць забойствы праз адлегласць. Магло незаўважна набіраць тэмп і да 60ых
2. Разам з тым, развіццё крыміналістыкі дапамагло гэта заўважыць, канцэптуалізаваць "серыйных забойцаў" як феномен
3. Распаўсюд ТБ і масмедыя агулам прасунуў серыйных забойцаў у навінавы авангард. Сыходзячы з дапушчэння, што ім гэта падабалася, маем дадатковы стымул
4. Свінец. На другім графіку бачым пік канцэнтрацыі свінца ў крыві амерыканцаў ў 80-ыя. Ёсць даныя пра моцную карэляцыю паміж атрчуваннем свінцом у дзяцінстве і схільнасцю да гвалту

Пра падзенне:
1. Яшчэ большае развіццё крыміналістыкі, прафайлінга, ДНК тэстаў, а таксама камеры зрабілі забойствы імпрэзай куды больш складанай. Гэта, імаверна, асноўная прычына
2. Грамадства вырашыла, што труціць дзяцей свінцом не самая яскравая ідэя
Лінейная (аг | рэг) рэсія

10 May, 07:12

1,697

^ народ з гісторыі парваўся і пабёг пераправяраць ягоныя паперы на прадмет памылак. Аўтыстаў з ведамі статыстыкі ў інтэрнэтах агулам больш чым папулярных падкасцераў

І яны там канешне ж ёсць. Напрыклад у паперы пра "cyclic sighing" — тэхніку дыхання, якую ён прасоўвае і якая "працуе лепш чым медытацыя"

Калі глянуць на таблу (6 радок), бачым, у перакладзе на простую мову, што чым больш чалавек практыкуе гэтую тэхніку, тым лепшы эфект. Эфект вельмі статыстычна значны (p < 0.01)

Праблема ў тым, што калі глянуць на давяральныя інтэрвалы, яны перасякаюць нуль. Гэта абсурд матэматычны, так не бывае, але і з практычнага пункту гледжання абсурд: калі вы сцвярджаеце, што нешта мае моцны пазітыўны эфект, хацелася б, каб давяральны інтэрвал не ўключаў рэгіён з негатыўнымі эфектамі. Лагічна? Лагічна
Лінейная (аг | рэг) рэсія

09 May, 16:13

1,592

Мой любімы падкасцер, Эндрю Губерман

Распавёў тут, што шанец жанчыны зацяжарыць, калі спрабаваць, роўны 20% у месяц. І таму калі спрабаваць паўгады — зацяжарыш з шанцам 120%

Як вам, жанчыны, жывецца ў сусвеце, дзе шанцы перавышаюць 100%? Трымайцеся

Правільны адказ дарэч 1 - 0.8^6 = ~74%
Лінейная (аг | рэг) рэсія

03 May, 08:10

2,390

Платформа interviewing.io правяла эксперымент, каб высветліць, наколькі тэхнічныя рэкрутары у ІТ здольныя ацэньваць кандыдатаў

76 рэкрутараў, 30 рэзюме на кожнага, 2.200 ацэнак у суме. Некаторых кандыдатаў ацэньвала некалькі рэкрутараў

Высновы:

1. Рэкрутары ацэньвалі імавернасць таго, што кандыдат пройдзе тэхнічнае інтэрв'ю на платформе. З тых, каму яны далі 0-5% шанец, 47% паспяхова прайшлі інтэрв'ю. А з тых, каму яны далі 95-100% шанец, 64% прайшлі інтэрв'ю. Кажучы проста, якую б імавернасць яны не паставілі, шанец прайсці інтэрв'ю быў каля 50% (лінія на графіку ляжыць амаль гарызантальна)

2. Для тых кандыдатаў, якіх ацэньвалі больш за аднаго рэкрутара, сярэдняя розніца паміж ацэнкамі складала 41 працэнтны пункт

Гэта не першае падобнае даследаванне і тычыцца не толькі ІТ

Ёсць такая кніга, Bullshit jobs. Напісаная яна ўльтралевым антраполагам і чытаць яе натуральна немагчыма. Але пачалася яна з аднайменнага эсэ і з ім рэкамендую азнаёміцца. Я сам з паловай пасылаў не згодны, але прынамсі каб ведаць адкуль тэрмін пайшоў