Графические вероятностные модели 2024

Это курс о вероятностных моделях, алгоритмах приближённого байесовского вывода и обучении с подкреплением, представленный на Факультете математики и компьютерных наук Санкт-Петербургского государственного университета весной 2024 года.

Деревья принятия решений и бустинг thumbnail
1

Деревья принятия решений и бустинг

15 февраля 2024 г.

[2 лекции] Деревья принятия решений. Методы объединения моделей. Бустинг: AdaBoost, градиентный бустинг, XGBoost.

Обучение ранжированию, SVM I thumbnail
2

Обучение ранжированию, SVM I

22 февраля 2024 г.

[2 лекции] Обучение ранжированию: метрики, RankNet, LambdaRank, MART, LambdaMART. Геометрическая интуиция SVM.

SVM II, ядра, RVM thumbnail
3

SVM II, ядра, RVM

29 февраля 2024 г.

[2 лекции] Метод опорных векторов: задачи оптимизации, их эквивалентность, идея ядер. Эквивалентное ядро в линейной регрессии и ядерные методы. Метод релевантных векторов: идея, вывод, алгоритмы.

Кластеризация и EM-алгоритм thumbnail
4

Кластеризация и EM-алгоритм

1 марта 2024 г.

[2 лекции] Кластеризация. EM-алгоритм для кластеризации, идея, вывод в общем виде. Примеры применений и расширения EM. Модели Брэдли-Терри

Примеры EM-алгоритма, HMM thumbnail
5

Примеры EM-алгоритма, HMM

14 марта 2024 г.

[2 лекции] Примеры применения EM-алгоритма: presence-only data, байесовские рейтинг-системы, скрытые марковские модели.

Графические вероятностные модели thumbnail
6

Графические вероятностные модели

28 марта 2024 г.

[2 лекции] Графические вероятностные модели. Алгоритм передачи сообщений.

Методы сэмплирования в ML thumbnail
7

Методы сэмплирования в ML

4 апреля 2024 г.

[2 лекции] Сэмплирование в машинном обучении: выборка с отклонением, выборка с весами значимости, алгоритм Метрополиса-Гастингса, сэмплирование по Гиббсу.

SIR-модели в эпидемиологии thumbnail
8

SIR-модели в эпидемиологии

6 апреля 2024 г.

[2 лекции] Развёрнутый пример: SIR-модели в эпидемиологии. Идея вариационных приближений.

Вариационные приближения thumbnail
9

Вариационные приближения

8 апреля 2024 г.

[2 лекции] Вариационные приближения: идея, вывод, простые примеры, вариационное приближение для смеси гауссианов. От наивного Байеса к тематическим моделям.

Тематическое моделирование I thumbnail
10

Тематическое моделирование I

11 апреля 2024 г.

[2 лекции] Тематическое моделирование: pLSI, ARTM, суть модели LDA. Вариационный вывод в LDA.

Тематическое моделирование II thumbnail
11

Тематическое моделирование II

17 апреля 2024 г.

[2 лекции] Сэмплирование по Гиббсу в LDA. Expectation Propagation и модель TrueSkill.

RL I: введение, многорукие бандиты thumbnail
12

RL I: введение, многорукие бандиты

25 апреля 2024 г.

[2 лекции] Введение в обучение с подкреплением. Многорукие бандиты. Марковские процессы принятия решений: уравнения Беллмана.

RL II: MC-методы, TD-обучение thumbnail
13

RL II: MC-методы, TD-обучение

2 мая 2024 г.

[2 лекции] Обучение с подкреплением: методы Монте-Карло, TD-обучение.

RL III: градиент по стратегиям, планирование thumbnail
14

RL III: градиент по стратегиям, планирование

16 мая 2024 г.

[2 лекции] Обучение с подкреплением II: TD-обучение, градиент по стратегиям, планирование, rollouts и MCTS.

RL IV, порождающие и дискриминирующие модели thumbnail
15

RL IV, порождающие и дискриминирующие модели

18 мая 2024 г.

[2 лекции] Case study: компьютерное го, AlphaGo, AlphaZero, MuZero. Порождающие и дискриминирующие модели: наивный Байес и логистическая регрессия, HMM и CRF.