{"id":2175,"url":"\/distributions\/2175\/click?bit=1&hash=803b6e1bcbd9dfc4ba9456fda887a878c80d24df8d3a575913b14876e18923a5","title":"TJ \u0437\u0430\u043a\u0440\u043e\u0435\u0442\u0441\u044f 10 \u0441\u0435\u043d\u0442\u044f\u0431\u0440\u044f \u2014\u00a0\u043f\u0440\u043e\u0447\u0438\u0442\u0430\u0439\u0442\u0435 \u0430\u043d\u043e\u043d\u0441 \u0441 \u0434\u0435\u0442\u0430\u043b\u044f\u043c\u0438","buttonText":"\u0427\u0438\u0442\u0430\u0442\u044c","imageUuid":"d1d355d8-93a3-5140-aeae-14b03046b760","isPaidAndBannersEnabled":false}

Прогноз пандемии коронавируса. Нормальное распределение

Прогноз развития эпидемии в России​ coronavirussia.online

Как и все сознательные люди, я сижу дома и пытаюсь себя всячески развлечь. Но со всех утюгов только и слышно, что про коронавирус.

Решил я узнать, когда же закончится эта канитель. Покопался в интернете и на то время ничего конкретного ни нашел.

На своей работе я уже давно ничего не программировал, а руки-то чешутся. Вот и придумал написать сайт, который соберет данные из открытых источников, красиво их отобразит их, да и еще сделает прогноз, что будет дальше.

Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса. Его и взял за основу.

Для начала подключился к открытым источникам и научился выкачивать данные раз в 15 минут. Отобразил их красиво с помощью Chart.js и перешел к прогнозу. Взял для работы функцию нормального распределения

y(t) = b · e -c·(t-a)2

Исходные данные ti — ежедневные отметки времени xi — число активных случаев болезни в этот день

Взял натуральный логарифм от y(t) и от данных xi

ui = ln(xi) u(t) = ln(y) = ln(b) - c·t2 + 2c·a·t - c·a2

Сделаем замены: А=-с; B=2a·c; C=ln(b)-c·a2; Получаем

u(t) = A·t2 + B·t + C

Чтобы найти А, В и С — использую метод наименьших квадратов, согласно которому сумма по i от 1 до n квадратов разностей

Σ(xi - y(ti))2 -> min

должна стремится к минимуму.

Назовем эту сумму Ф (A, В, С)

Продифференцируем dФ по dA, dB и dC. Производные при это должны быть равны нулю.

Получаем систему уравнений

A·Σti4 + B·Σti3 + C·Σti2 = Σui·ti2

A·Σti3 + B·Σti2 + C·Σti = Σui·ti

A·Σti2 + B·Σti + C·n = Σui

Решаем эту систему по методу Крамера

А = ∆A/∆

B = ∆B/∆

C = ∆C/∆

Находим нужные коэффициенты a, b , c для исходной функции

И, вуаля, готово! Программируем и рисуем красивые графики и узнаем когда это кончится!

Так как данные обновляются с появлением новых случаев, и мой прогноз обновляется тоже.

Чем больше данных, тем точнее прогноз. На данный момент, реальные данные экспертов в Италии говорят о пике эпидемии, и кривая Гаусса показывает тоже самое.

​Прогноз развития эпидемии в Италии coronavirussia.online

По ссылке ниже смотрите прознозы для других стран и для всей планеты

Данные обновляются каждые 15 минут и прогнозы соответственно тоже!

Будьте здоровы!

0
120 комментариев
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Dragan Velimirovic
задолбалась от постоянных скачков состояния

Состояние "пофиг" не пробовала?

Ответить
Развернуть ветку
5 комментариев
Pavel Zamyatin

Мы все умрем, но это ок.

Ответить
Развернуть ветку
Marat Khamadeev
Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса.

Пруф или Петрик.
Вы ведь не физик, да? Гауссов профиль получается только в простейших моделях заражения в одномерном ограниченном пространстве. У вас же здесь распространение по поверхности сферы, здесь даже модельный профиль должен быть не симметричен по времени, не говоря уже о миллионах факторов, в том числе таких важных, как распределение людей по площади. Всё это накапливает сомнения в предсказательной силе ваших графиков.
Да и вообще, по маленькой краюхе восстановливать дальний порядок - это крайне некорректная задача. Это означает, что малое изменение начального параметра может привести к сильному изменению всего графика. Работает эффект рычага. Особенно это важно, учитывая, что точки далеко не идеально ложатся на кривую, то есть есть погрешности. Это означает, что погрешность итогового графика окажется слишком большой, чтобы весь расчёт считался надёжным предсказанием. Вы можете сами это оценить, посчитав дисперсию и построив два графика для разных концов стартового распределения параметров.

Ответить
Развернуть ветку
Marat Khamadeev

Ну и вообще с моих позиций статья о том, как вы изобрели велосипед, который едет очень плохо. Конечно, МНК и метод Крамерса - это, конечно, хорошо, но неужели нет готовых решений для этого? В распространенных матпакетах типа Матлаба или Маткада функции подгона идут из коробки.

Ответить
Развернуть ветку
2 комментария
artur krugliy

ты, наверное, пропустил, что pornhub, халявный премиум всем дали ....

спасибо за сайт 

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Точно, пошел смотреть

Ответить
Развернуть ветку
1 комментарий
пиу-пиу

Вот несколько моментов смутили:
1) Статистика идёт только по тем, кто проверился. Полной картины мы не знаем.
2) Распределение же должно иметь некий изгиб в момент, когда внедрили карантины и самоизоляции. И конечно когда стали проверять больше. Ну и учитывая факт, что умирают не все, и вылечиваются по разным сценариям. 

Например мне кажется более логична модель того же  Plague Inc, где когда находят лекарство, число зараженных падает значительно быстрее, чем до лекарства.

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Ясно что факторов много, но в итоге по статистике все равно получиться приблизительно нормальное распределение

Ответить
Развернуть ветку
4 комментария
Володь, пойдем говно молоть

Можно на Китай посмотреть, где все закончилось, как образец. Там плюс-минус все отражено в действительном графике роста больных и он похож на норм. распределение (ну почти) 

Ответить
Развернуть ветку
1 комментарий
Лис Микола
1) Статистика идёт только по тем, кто проверился. Полной картины мы не знаем.

А можно как то иначе оформить?)))

Ответить
Развернуть ветку
Плюшевый Батон

Бро, похоже это единственный сайт со всеми графиками в одном месте. Причем кажется в начале много таких сайтов было, но потом все ушли в какую-то ебанину, вроде текстовой статистики – приходится ходить по 10 ресурсам, что бы собрать в одном место все.

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Спасибо, сохраняй в закладки!

Ответить
Развернуть ветку
Andrew Dos Santos

а как же 

Ответить
Развернуть ветку
1 комментарий
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Смотри еще и Логнорму натянул)

Ответить
Развернуть ветку
Ladd

Это и есть Data seines?

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

science)

Ответить
Развернуть ветку
1 комментарий
Ava Lord

sisens

Ответить
Развернуть ветку
Stan Majors

Ты че пес я инженер!)

Ответить
Развернуть ветку
Лис Микола

Единственное, чего не хватает, это распределение по возрастами. Было бы оч здорово

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
1 комментарий
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Замир

У Ирана какая-то херня с данными?

Ответить
Развернуть ветку
Замир
Ответить
Развернуть ветку
5 комментариев
Странный фермер

Время ставить на сайт google adsense ;)

Ответить
Развернуть ветку
Хороший укроинец

Теперь нашей власти не надо будет придумывать новые цифры, они просто будут следовать твоим графикам :D

Ответить
Развернуть ветку
Лис Микола

в Хохланд все очень даже позитивненько

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
3 комментария
Orbital_Cat

а где можно смотреть онлайн или ты так, на 5 мин заморочился ради картинки?

Ответить
Развернуть ветку
3 комментария
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Dragan Velimirovic

Прогноз невалиден. По крайней мере, представленный на скрине.

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Прогноз обновляется каждый день, когда поступают новые данные, чем больше данных, тем точнее прогноз

Ответить
Развернуть ветку
1 комментарий
Andriy Podorozhniak

А Украина?(

Ответить
Развернуть ветку
Алексей Калинин

Маловато данных пока.

Ответить
Развернуть ветку
Ava Lord

Я не совсем понял, почему пик прогноза по "болеющим" во вкладке "Весь мир" произойдёт примерно 17-20 мая, хотя если отдельно полистать страны, то во всех 17-20 мая - это почти полный спад по болеющим.

Ответить
Развернуть ветку
Георгий Логутенко

А что там у хохлов?
п.с. прогноз австралии выглядит жутко

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

вдогонку к Гаусу сделал Логнорму - она вроде лучше показывает

Вся сложность в том, что если брать кучу показателей от которых реально зависит развитие эпидемии, то ошибка будет умножаться от их неточности 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Игорь Янович

А прологарифмировать показатель степени и вынести множитель за скобки забыл?
Переделывай :)

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Не забыл, смотри внимательней)

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Обобщая все вопросы к прогнозу, понял что основной вопрос — это почему Гаусс?

У Китая склон спада более пологий чем склон подъема, что не похоже на симметричного Гаусса, но похоже на логнормальное распределение.

Добавил новый прогноз, на котором вместе отображаются и Гаусс и Логнорма

У некоторых стран, например у России, не считается долгосрочный прогноз - данные такие, что Логнорма очень хорошо проходит по точкам, но не чувствует пика и рисует его очень далеко и высоко. 
Для таких стран отображаю прогноз на 20 дней вперед. Думаю, по мере поступления новых данных, это пройдет.

А вообще, если по всем странам посмотреть, то Логнорма везде лучше, чем Гаусс. 

Как думаете для обсуждения нового прогноза,  сделать отдельный пост, где подробно расскажу о новом прогнозе?

https://coronavirussia.online/prognoz/All

Ответить
Развернуть ветку
Людмила

Еще непонятно как Африка себя поведет. 

Ответить
Развернуть ветку
Dear Moscow,
 непонятно как Африка себя поведет
Ответить
Развернуть ветку
1 комментарий
Александра Хотимченко

Они и как и китайцы всех переживут 

Ответить
Развернуть ветку
Eduard Vakhitov

В Танзании сейчас 20 заражённых. Первый был выявлен более 2 недель назад. Режим самоизоляции введён две недели назад 

Ответить
Развернуть ветку
Dragan Velimirovic

Простите, не удержался

Ответить
Развернуть ветку
1 комментарий
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Спасибо, подписывайся на https://www.instagram.com/coronavirussia.online/

Ответить
Развернуть ветку
2 комментария
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Sage Pointer

Красным обозначены не те, кто в данный момент заражены, а те, кто вообще был заражён

Ответить
Развернуть ветку
4 комментария
miha pntv

Опечатки

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

)) попрвил

Ответить
Развернуть ветку
2 комментария
Dear Moscow,
/gaus/Russia

Вообще-то он Гаусс, прогнозяторы.

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

блин(

Ответить
Развернуть ветку
Антон Жучков
Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Некоторые страны видимо так публикуют данные, что по ним не строится функция(

Видимо что-то скрывают

Ответить
Развернуть ветку
1 комментарий
Roman Bublik

Добавь переключатель на log шкалу

Ответить
Развернуть ветку
Nikita

т.е. судя по прогрозу, в России на пике будет заражено "всего" 27 000 человек? А в той же США 300 000 зараженных и они все ещё в начале графика? 

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Это просто статистическая модель, основанная на данных до вчерашнего дня (типа что будет если все продолжится в том же духе) а если например завтра появятся новые данные что количество новых случаев в России или США начинает падать или наоборот резко расти, то прогноз измениться и по пику и по длительности, так что надо следить каждый день

Ответить
Развернуть ветку
Bu

А что происходит на графике в Норвегии? Почему прогноз не изменился под реалии?

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

я хз, такие у них данные, как считается модель описано ниже, некоторые страны вообще не считает( 

Ответить
Развернуть ветку
Борис Силаков

https://coronavirussia.online/gaus/Australia
https://coronavirussia.online/gaus/All
То есть в мире будет болеть людей меньше чем в Австралии? Что-то не очень прогноз.

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Видимо по тем точкам данных, что Австралия передает, только такая кривая строится, думаю со временем исправиться.

Ответить
Развернуть ветку
1 комментарий
Vitalii Nechaev

А почему сразу не прогнозировать линию смерти и выздоровления хотя бы примерно, от прогноза всего заразившихся?
Например мы по другим странам знаем процент летальности, от и до, почему бы не накладывать эти от и до на графике и штриховать участок между ними, чтобы было ясно, мол вот это при летальности условной Италии/США, а вот это это летальность условной Кореи, а вот средняя. 
Всё это исходя из прогноза конкретной страны по зараженным.

Ответить
Развернуть ветку
Алексей Калинин

Яндекс карты плохо. Сделай OSM.

Ответить
Развернуть ветку
Nikolay Talanov

Я в данный момент работаю в компании, которая находится под крылом Singapore Airlines. 30 марта был Board Meeting, на котором они сказали что в Юго-Восточной азии границы для перелетов начнут открывать дай бог к октябрю-декабрю, и то только в "хороших" странах, где еще с начала февраля как следует оберегались от вируса (про Индонезию например сказали что они будут в числе последних). А ведь Сингапур и многие подобные страны на несколько световых лет впереди могучей россюшки и подобных мест. Так что с расчетами на то что к июню всё будет заебись вас скорее всего будет ожидать крайне ахуительное продолжение года. Хотя конечно хотелось бы верить в лучшее.

Ответить
Развернуть ветку
Павел Тявин

Нормальное распределение показателя процесса от времени встречается очень редко. Да никогда оно не встречается. Я даже не могу ни одного дифура придумать, который бы моделировал какой-нибудь процесс, где есть нормальное распределение по времени. Разве что если бы все заразились бы в один день, но есть расброс инкубационного периода, который (вдруг?) распределен близко к нормальному

Ответить
Развернуть ветку
Саша Радославов

Можно попросить вас добавить Индонезию?

Ответить
Развернуть ветку
Elwuts

Мужик, годный сервис. Хотел рассказать о нем в инсте, но он блокирует сторис о коронавирусе :(

Ответить
Развернуть ветку
mrmilashka

Не верю, что в России при ?130? Млн. Населения будет 30к зараженых, склоняюсь к 100-150к

Ответить
Развернуть ветку
Владимир Прохоровитч

Зачем Гаусс? Просто смоделируй процесс. Мат модели есть готовые, ничего изобретать не надо. Вот тебе даже формулы :)

Ответить
Развернуть ветку
Max Max

у вас явно где-то ошибка. Только по Австралии на 27.06 показывает почти 9М а в мире на ту же дату чуть больше 1М
отрицательных показателей при этом ни в одной стране, конечно же, нет :) 

Ответить
Развернуть ветку
Коронавирус Онлайн
Автор

Из-за того что каждая страна по разному диагностирует день ото дня, в базу попадает не совсем хорошая выборка, ну и прогноз в этом случае не получается.

Сейчас вроде Австралия  нормальную линию рисует

Ответить
Развернуть ветку
1 комментарий
Кириченко Станислав

Там диванные войска без программирования из твиттера сделали свои прогнозы, на выдуманных коэффициентах, и там тоже вполне себе ничего прогноз - https://virology.su/prognoz.html как и все в принципе. 

Ответить
Развернуть ветку
Эва Синельникова

https://vpn.business-online.ru/article/463007?fbclid=IwAR0C_uQ13T-oqtGzDbZ9SDmDubin9GlgD62WEaXTLQgy3pPFwYU5XvDsfnY 
Статья дэн и кф-мн Ивана Дмитриевича Грачёва для особо упёртых диваныых комментаторов

Ответить
Развернуть ветку
Павел Гуров

И всё таки модель Гауса не работает, более прогнозируемым остается модель SIR и её вариации. Но точно рассчитать под каждую страну не просто. Вот расчет для России. Прогноз строится в коридоре между худшим и лучшим случаями https://coronavirus-hub.ru/russia/ .Используется модель SIR

Ответить
Развернуть ветку
Читать все 120 комментариев
null