Как и все сознательные люди, я сижу дома и пытаюсь себя всячески развлечь. Но со всех утюгов только и слышно, что про коронавирус.
Решил я узнать, когда же закончится эта канитель. Покопался в интернете и на то время ничего конкретного ни нашел.
На своей работе я уже давно ничего не программировал, а руки-то чешутся. Вот и придумал написать сайт, который соберет данные из открытых источников, красиво их отобразит их, да и еще сделает прогноз, что будет дальше.
Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса. Его и взял за основу.
Для начала подключился к открытым источникам и научился выкачивать данные раз в 15 минут. Отобразил их красиво с помощью Chart.js и перешел к прогнозу. Взял для работы функцию нормального распределения
y(t) = b · e -c·(t-a)2
Исходные данные ti — ежедневные отметки времени xi — число активных случаев болезни в этот день
Взял натуральный логарифм от y(t) и от данных xi
ui = ln(xi) u(t) = ln(y) = ln(b) - c·t2 + 2c·a·t - c·a2
Сделаем замены: А=-с; B=2a·c; C=ln(b)-c·a2; Получаем
u(t) = A·t2 + B·t + C
Чтобы найти А, В и С — использую метод наименьших квадратов, согласно которому сумма по i от 1 до n квадратов разностей
Σ(xi - y(ti))2 -> min
должна стремится к минимуму.
Назовем эту сумму Ф (A, В, С)
Продифференцируем dФ по dA, dB и dC. Производные при это должны быть равны нулю.
Получаем систему уравнений
A·Σti4 + B·Σti3 + C·Σti2 = Σui·ti2
A·Σti3 + B·Σti2 + C·Σti = Σui·ti
A·Σti2 + B·Σti + C·n = Σui
Решаем эту систему по методу Крамера
А = ∆A/∆
B = ∆B/∆
C = ∆C/∆
Находим нужные коэффициенты a, b , c для исходной функции
И, вуаля, готово! Программируем и рисуем красивые графики и узнаем когда это кончится!
Так как данные обновляются с появлением новых случаев, и мой прогноз обновляется тоже.
Чем больше данных, тем точнее прогноз. На данный момент, реальные данные экспертов в Италии говорят о пике эпидемии, и кривая Гаусса показывает тоже самое.
По ссылке ниже смотрите прознозы для других стран и для всей планеты
Данные обновляются каждые 15 минут и прогнозы соответственно тоже!
Будьте здоровы!
Комментарий недоступен
Состояние "пофиг" не пробовала?
Мы все умрем, но это ок.
Пруф или Петрик.
Вы ведь не физик, да? Гауссов профиль получается только в простейших моделях заражения в одномерном ограниченном пространстве. У вас же здесь распространение по поверхности сферы, здесь даже модельный профиль должен быть не симметричен по времени, не говоря уже о миллионах факторов, в том числе таких важных, как распределение людей по площади. Всё это накапливает сомнения в предсказательной силе ваших графиков.
Да и вообще, по маленькой краюхе восстановливать дальний порядок - это крайне некорректная задача. Это означает, что малое изменение начального параметра может привести к сильному изменению всего графика. Работает эффект рычага. Особенно это важно, учитывая, что точки далеко не идеально ложатся на кривую, то есть есть погрешности. Это означает, что погрешность итогового графика окажется слишком большой, чтобы весь расчёт считался надёжным предсказанием. Вы можете сами это оценить, посчитав дисперсию и построив два графика для разных концов стартового распределения параметров.
Ну и вообще с моих позиций статья о том, как вы изобрели велосипед, который едет очень плохо. Конечно, МНК и метод Крамерса - это, конечно, хорошо, но неужели нет готовых решений для этого? В распространенных матпакетах типа Матлаба или Маткада функции подгона идут из коробки.
ты, наверное, пропустил, что pornhub, халявный премиум всем дали ....
спасибо за сайт
Точно, пошел смотреть
Вот несколько моментов смутили:
1) Статистика идёт только по тем, кто проверился. Полной картины мы не знаем.
2) Распределение же должно иметь некий изгиб в момент, когда внедрили карантины и самоизоляции. И конечно когда стали проверять больше. Ну и учитывая факт, что умирают не все, и вылечиваются по разным сценариям.
Например мне кажется более логична модель того же Plague Inc, где когда находят лекарство, число зараженных падает значительно быстрее, чем до лекарства.
Ясно что факторов много, но в итоге по статистике все равно получиться приблизительно нормальное распределение
Можно на Китай посмотреть, где все закончилось, как образец. Там плюс-минус все отражено в действительном графике роста больных и он похож на норм. распределение (ну почти)
А можно как то иначе оформить?)))
Бро, похоже это единственный сайт со всеми графиками в одном месте. Причем кажется в начале много таких сайтов было, но потом все ушли в какую-то ебанину, вроде текстовой статистики – приходится ходить по 10 ресурсам, что бы собрать в одном место все.
Спасибо, сохраняй в закладки!
а как же
Комментарий недоступен
Комментарий недоступен
Смотри еще и Логнорму натянул)
Это и есть Data seines?
science)
sisens
Ты че пес я инженер!)
Единственное, чего не хватает, это распределение по возрастами. Было бы оч здорово
Комментарий недоступен
Комментарий недоступен
У Ирана какая-то херня с данными?
Время ставить на сайт google adsense ;)
Теперь нашей власти не надо будет придумывать новые цифры, они просто будут следовать твоим графикам :D
в Хохланд все очень даже позитивненько
Комментарий недоступен
а где можно смотреть онлайн или ты так, на 5 мин заморочился ради картинки?
Комментарий недоступен
Прогноз невалиден. По крайней мере, представленный на скрине.
Прогноз обновляется каждый день, когда поступают новые данные, чем больше данных, тем точнее прогноз
А Украина?(
Маловато данных пока.
Я не совсем понял, почему пик прогноза по "болеющим" во вкладке "Весь мир" произойдёт примерно 17-20 мая, хотя если отдельно полистать страны, то во всех 17-20 мая - это почти полный спад по болеющим.
А что там у хохлов?
п.с. прогноз австралии выглядит жутко
Комментарий недоступен
вдогонку к Гаусу сделал Логнорму - она вроде лучше показывает
Вся сложность в том, что если брать кучу показателей от которых реально зависит развитие эпидемии, то ошибка будет умножаться от их неточности
Комментарий недоступен
А прологарифмировать показатель степени и вынести множитель за скобки забыл?
Переделывай :)
Не забыл, смотри внимательней)
Обобщая все вопросы к прогнозу, понял что основной вопрос — это почему Гаусс?
У Китая склон спада более пологий чем склон подъема, что не похоже на симметричного Гаусса, но похоже на логнормальное распределение.
Добавил новый прогноз, на котором вместе отображаются и Гаусс и Логнорма
У некоторых стран, например у России, не считается долгосрочный прогноз - данные такие, что Логнорма очень хорошо проходит по точкам, но не чувствует пика и рисует его очень далеко и высоко.
Для таких стран отображаю прогноз на 20 дней вперед. Думаю, по мере поступления новых данных, это пройдет.
А вообще, если по всем странам посмотреть, то Логнорма везде лучше, чем Гаусс.
Как думаете для обсуждения нового прогноза, сделать отдельный пост, где подробно расскажу о новом прогнозе?
https://coronavirussia.online/prognoz/All
Еще непонятно как Африка себя поведет.
Они и как и китайцы всех переживут
В Танзании сейчас 20 заражённых. Первый был выявлен более 2 недель назад. Режим самоизоляции введён две недели назад
Простите, не удержался
Комментарий недоступен
Спасибо, подписывайся на https://www.instagram.com/coronavirussia.online/
Комментарий недоступен
Красным обозначены не те, кто в данный момент заражены, а те, кто вообще был заражён
Опечатки
)) попрвил
Вообще-то он Гаусс, прогнозяторы.
блин(
https://coronavirussia.online/gaus/Malaysia выдаёт ошибку
Некоторые страны видимо так публикуют данные, что по ним не строится функция(
Видимо что-то скрывают
Добавь переключатель на log шкалу
т.е. судя по прогрозу, в России на пике будет заражено "всего" 27 000 человек? А в той же США 300 000 зараженных и они все ещё в начале графика?
Это просто статистическая модель, основанная на данных до вчерашнего дня (типа что будет если все продолжится в том же духе) а если например завтра появятся новые данные что количество новых случаев в России или США начинает падать или наоборот резко расти, то прогноз измениться и по пику и по длительности, так что надо следить каждый день
А что происходит на графике в Норвегии? Почему прогноз не изменился под реалии?
я хз, такие у них данные, как считается модель описано ниже, некоторые страны вообще не считает(
https://coronavirussia.online/gaus/Australia
https://coronavirussia.online/gaus/All
То есть в мире будет болеть людей меньше чем в Австралии? Что-то не очень прогноз.
Видимо по тем точкам данных, что Австралия передает, только такая кривая строится, думаю со временем исправиться.
А почему сразу не прогнозировать линию смерти и выздоровления хотя бы примерно, от прогноза всего заразившихся?
Например мы по другим странам знаем процент летальности, от и до, почему бы не накладывать эти от и до на графике и штриховать участок между ними, чтобы было ясно, мол вот это при летальности условной Италии/США, а вот это это летальность условной Кореи, а вот средняя.
Всё это исходя из прогноза конкретной страны по зараженным.
Яндекс карты плохо. Сделай OSM.
Я в данный момент работаю в компании, которая находится под крылом Singapore Airlines. 30 марта был Board Meeting, на котором они сказали что в Юго-Восточной азии границы для перелетов начнут открывать дай бог к октябрю-декабрю, и то только в "хороших" странах, где еще с начала февраля как следует оберегались от вируса (про Индонезию например сказали что они будут в числе последних). А ведь Сингапур и многие подобные страны на несколько световых лет впереди могучей россюшки и подобных мест. Так что с расчетами на то что к июню всё будет заебись вас скорее всего будет ожидать крайне ахуительное продолжение года. Хотя конечно хотелось бы верить в лучшее.
Нормальное распределение показателя процесса от времени встречается очень редко. Да никогда оно не встречается. Я даже не могу ни одного дифура придумать, который бы моделировал какой-нибудь процесс, где есть нормальное распределение по времени. Разве что если бы все заразились бы в один день, но есть расброс инкубационного периода, который (вдруг?) распределен близко к нормальному
Можно попросить вас добавить Индонезию?
Мужик, годный сервис. Хотел рассказать о нем в инсте, но он блокирует сторис о коронавирусе :(
Не верю, что в России при ?130? Млн. Населения будет 30к зараженых, склоняюсь к 100-150к
Зачем Гаусс? Просто смоделируй процесс. Мат модели есть готовые, ничего изобретать не надо. Вот тебе даже формулы :)
у вас явно где-то ошибка. Только по Австралии на 27.06 показывает почти 9М а в мире на ту же дату чуть больше 1М
отрицательных показателей при этом ни в одной стране, конечно же, нет :)
Из-за того что каждая страна по разному диагностирует день ото дня, в базу попадает не совсем хорошая выборка, ну и прогноз в этом случае не получается.
Сейчас вроде Австралия нормальную линию рисует
Там диванные войска без программирования из твиттера сделали свои прогнозы, на выдуманных коэффициентах, и там тоже вполне себе ничего прогноз - https://virology.su/prognoz.html как и все в принципе.
https://vpn.business-online.ru/article/463007?fbclid=IwAR0C_uQ13T-oqtGzDbZ9SDmDubin9GlgD62WEaXTLQgy3pPFwYU5XvDsfnY
Статья дэн и кф-мн Ивана Дмитриевича Грачёва для особо упёртых диваныых комментаторов
И всё таки модель Гауса не работает, более прогнозируемым остается модель SIR и её вариации. Но точно рассчитать под каждую страну не просто. Вот расчет для России. Прогноз строится в коридоре между худшим и лучшим случаями https://coronavirus-hub.ru/russia/ .Используется модель SIR