Скачать 178.16 Kb.
|
Санкт-Петербургский филиал федерального государственного автономного образовательного учреждения высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет Санкт-Петербургская школа экономики и менеджмента НИУ ВШЭ – Санкт-Петербург Утверждена ученым советом НИУ ВШЭ – Санкт-Петербург протокол от «___» 2016 г. № _____ Председатель _____________С.М. Кадочников «____» _____________2016 г. Программа итогового экзамена по направлению 01.04.02 "Прикладная математика и информатика" Магистерская программа "Анализ больших данных в бизнесе, экономике и обществе" Академический руководитель А.В. Сироткин Санкт-Петербург, 2016 ВВЕДЕНИЕ Основная тематика, включаемая в государственный междисциплинарный экзамен Государственный междисциплинарный экзамен по направлению – 01.04.02 "Прикладная математика и информатика" включает дисциплины: Современные методы анализа данных Современные методы принятия решений Алгоритмы и структуры данных Теория игр Математические основы анализа данных Практическое программирование и анализ данных в специализированных средах Требования к магистранту по направлению – 01.04.02 "Прикладная математика и информатика", предусмотренные государственным образовательным стандартом. Магистр знает:
Магистр умеет:
Магистр программы "Анализ больших данных в бизнесе, экономике и обществе" по направлению подготовки «Прикладная математика и информатика» с в соответствии с целями основной образовательной программы и задачами профессиональной деятельности в процессе написание государственного итогового экзамена должен продемонстрировать умение решать следующие профессиональные задачи: а) в научно-исследовательской деятельности (НИД):
Магистр программы "Анализ больших данных в бизнесе, экономике и обществе" по направлению подготовки «Прикладная математика и информатика» с в соответствии с целями и задами основной образовательной программы должен продемонстрировать владение следующими профессиональными компетенциями: Социально-личностными (СЛК) Способен определять, транслировать общие цели в профессиональной и социальной деятельности (ПК – 4). Инструментальными (ИК): Способен анализировать и воспроизводить смысл междисциплинарных текстов с использованием языка и аппарата прикладной математики (ПК – 10). Способен описывать проблемы и ситуации профессиональной деятельности, используя язык и аппарат прикладной математики при решении междисциплинарных проблем (ПК – 14). Способен использовать в профессиональной деятельности знания в области естественных наук, математики и информатики, понимание основных фактов, концепций, принципов теорий, связанных с прикладной математикой и информатикой (ПК – 16). Способен в составе научно-исследовательского и производственного коллектива решать задачи профессиональной деятельности в соответствии с профилем подготовки, общаться с экспертами в других предметных областях (ПК-19). Форма проведения государственного междисциплинарного экзамена по направлению Государственный междисциплинарный экзамен проводится в письменной форме. На выполнение письменного задания отводится 4 академических часа или 180 минут. Экзамен проводится в компьютерном классе. Теоретические ответы студента записываются и сохраняются в файлах в формате *.doc или *.pdf, практические – в соответствующей среде ПО. Члены экзаменационной комиссии знакомятся с распечатанными результатами теоретических вопросов, алгоритмом решения практических заданий и в соответствии с критериями выставляют студенту оценку. Распределение заданий по тематике: Задание 1: Анализ данных. Современные методы и математические основы анализа данных Задание 2: Теория принятия решений: методы и моделирование в теории принятия решений. Задание 3: Теория игр. Задание 4: Математические основы анализа данных. Практическое программирование и анализ данных в специализирован-ных средах Задания ставят перед студентом следующие задачи (1) применить знание теории и методов принятия решений и смежных дисциплин для анализа данных или какой-либо проблемной ситуации, (2) предложить методические решения какой-либо исследовательской задачи, (3) разработать алгоритм решения какой-либо проблемной области. Формы заданий ГИА
Формы контроля уровня сформированности компетенций
Критерии оценки. При проведении государственного междисциплинарного экзамена устанавливаются следующие критерии оценки знаний выпускников: Оценка «отлично» – студент верно, обоснованно и содержательно выполнил все четыре письменные задания из четырех. 10 – «блестяще» – четыре верных и исчерпывающих письменных ответов, 9 – «отлично» – четыре верно выполненных задания, однако есть пробелы в выполнении одного из четырех заданий; 8 «почти отлично» – четыре верно и полно выполненных заданий, но есть пробелы в выполнении двух заданий. Оценка «хорошо» – студент верно, обоснованно и содержательно выполнил не менее чем три из четырех заданий, а по четвертому продемонстрировал удовлетворительные знания; 7 – «очень хорошо» - верные и качественные ответы на три задания и удовлетворительные комментарии по четвертому; 6 – верные и качественные ответы на три задания; Оценка «удовлетворительно» – удовлетворительные результаты по трем заданиям либо верные и качественные ответы на два вопроса из четырех, 5 – «весьма удовлетворительно» - четыре удовлетворительных письменных ответа либо верные ответы на два вопроса из четырех; 4 – «удовлетворительно» - удовлетворительные письменные ответы на три вопроса и один ответ, содержащий как верные решения, так и ошибки. Оценка «неудовлетворительно» – правильные и обоснованные ответы менее чем на два письменных вопроса. Анализ данных. Современные методы и математические основы анализа данных Тема 1. Основы анализа данных Элементы линейной алгебры в задачах оптимизации и регрессии. Векторы, матрицы, матрично-векторные операции. проекция. Приближенное решение систем линейных уравнений. Собственные вектора и собственные значения. Разложения матриц. Задача регрессии, как задача оптимизации и ее решение в матричном виде. Классические статистические методы. Сравнение гипотез. Методы параметрического и непараметрического оценивания случайных величин. p-value и его применение в проверке гипотез. Поправки на множественные сравнения. Смеси распределений и оценки их параметров. Тема 2. Модели регрессий Правило Лапласа. Априорные распределения. Сопряжённые априорные распределения. Линейная регрессия. Логистическая регрессия. Статистическая теория принятия решений. Разложение bias-variance-noise. Оверфиттинг. Регуляризация: гребневая регрессия. Линейная регрессия по-байесовски. Линейная регрессия: разные формы регуляризаторов. Лассо-регрессия. Эквивалентные ядра. Проклятие размерности. Тема 3. Модели классификации Задачи классификации. Линейный дискриминант Фишера. Наивный байесовский классификатор: мультиномиальный и многомерный. Логистическая регрессия: как обучать. Мультиклассовая логистическая регрессия. Аппроксимация по Лапласу. Пробит. Логистическая регрессия по-байесовски. Метод опорных векторов (SVM). Трюк с ядрами. Варианты SVM. SVM по-байесовски: relevance vector machines. Кластеризация: иерархическая, методами теории графов. Алгоритм EM для кластеризации. Тема 4. Случайные процессы, семплирование и бустиг. Пуассоновский процесс. Марковские и не Марковские процессы. Случайные блуждания. Марковские цепи. Стационарные распределения. Процессы на графах. MCMC-методы, семплирование и алгоритм Метрополисс-Гастингсон. Скрытые марковские модели. Комбинация моделей: усреднение, бутстрап, бэггинг. Бустинг: AdaBoost. Обучение ранжированию: постановка задачи, RankBoost. LambdaRank. Рекомендательные системы: метод ближайших соседей, сингулярное разложение матриц. Основная литература
Дополнительная учебная литература.
Справочники, словари, энциклопедии
Современные методы принятия решений. Применение алгоритмов машинного обучения. Тема 1 Графические модели Графические модели: определения, обозначения, примеры. Маргинализация в общем виде, вывод на графе без циклов. Вывод на графе с циклами: вариационные приближения. Алгоритм EM в общем виде. Сэмплирование как метод приближённого вычисления. Методы сэмплирования. Тематическое моделирование и модель LDA. Вывод в моделях со сложными факторами: Expectation Propagation. Байесовские рейтинг-системы. Тема 2 Основы нейронных сетей Нейронные сети: перцептрон. Виды функций активации. Обучение одного перцептрона. История развития нейронных сетей. Градиентный спуск. Обратное распространение градиента на графе вычислений. Как сделать градиентный спуск быстрее и лучше. Метод моментов, методы второго порядка и другие трюки. Регуляризация в нейронных сетях. Дропаут и его мотивация. Другие методы. Тема 3 Специальные виды нейронных сетей Рекуррентные сети: базовые архитектуры, LSTM, GRU. Свёрточные сети: архитектуры, как обучать, для чего они нужны. Глубокие сети для обработки текстов I: распределённые представления слов. Глубокие сети для обработки текстов II: рекурсивные нейронныесети, сети со стеком, сети с памятью. Тема 4 Выбор стратегий с помощью нейросетей Обучение с подкреплением: основы, определения, классические алгоритмы Как работает AlphaGo: обучение с подкреплением на глубоких сетях. DQN. Соединяем байесовский вывод и глубокие сети: нейробайесовские методы. Основная литература
Дополнительная литература
Теория игр Тема 1. Матричные игры (антагонистические) . Решение матричных игр в чистых стратегиях. Стратегии максимина минимакса. Смешанные стратегии. Решение игры в смешанных стратегиях. Теория об активных стратегиях. Решение игры 2 на 2. Решение матричных игр 2 на n и m на 2 графическим методом. Доминирующая стратегия. Решение матричной игры m на n. Связь между матричной игрой и взаимно-свойственными задачами линейного программирования. Тема 2. Статистические игры . Принятие решений в условиях риска. Критерий Байеса относительно выигрышей. Критерий Байеса относительно рисков. Критерий Лапласа относительно выигрышей. Принятие решений в условиях неопределенности. Критерий Вальда (критерий крайнего пессимизма). Максимаксный критерий (критерий крайнего оптимизма). Критерий Сэвиджа (критерий минимаксного риска). Критерий Гурвица (критерий обобщенного максимума). Тема 3. Биматричные игры. Кооперация в играх с дискретным набором стратегий. Равновесие Нэша. Доминирование стратегий в биматричных играх. Теорема о равнове-сии по Нэшу в смешанных стратегиях. Необходимое и достаточное условие существование равновесие в биматричных игре. «Дилемма заключенных», «Семейный спор». Понятие о кооперации. Точка разногласий. Переговорное множество. Оптимальность по Парето. Поиск равновесного решения по арбитражной схеме Нэша. Тема 4. Игры с непрерывными стратегиями. Игры Курно, Бертрана, Штакельберга. Игры с непрерывными стратегиями. Модель дуополии Курно, монопольное решение. Равновесие Курно-Нэша. Цены как стратегии. Равновесие Бертрана. Игра Стакельберга, неустойчивость дуопольного решения. Тема 5. Кооперативные игры. Кооперативные игры n – лиц. Платежи. Существенные и несущественные игры. различные методы определения платежей. С – ядро. Вектор Шепли. Тема 6. Системы массового обслуживания. Понятие поток событий. Марковские процессы. СМО одноканальная, многоканальная. СМО без очереди, с ограниченной очередью, с неограниченной очередью. Основная литература
Дополнительная литература
Tarling R. Statistical Modeling for Social Researchers. Principles and Practice. – Routledge, 2009. Математические основы анализа данных Практическое программирование и анализ данных в специализированных средах Тема 1. Элементы линейной алгебры в задачах оптимизации и регрессии Векторы, матрицы, матрично-векторные операции. проекция. Приближенное решение систем линейных уравнений. Собственные вектора и собственные значения. Разложения матриц. Задача регрессии, как задача оптимизации и ее решение в матричном виде. Тема 2. Классические статистические методы Сравнение гипотез. Методы параметрического и непараметрического оценивания случайных величин. P-value и его применение в проверке гипотез. Поправки на множественные сравнения. Смеси распределений и оценки их параметров. Тема 3. Случайные процессы. Пуассоновский процесс. Марковские и не Марковские процессы. Случайные блуждания. Марковские цепи. Стационарные распределения. Процессы на графах. MCMC-методы, семплирование и алгоритм Метрополисс-Гастингсон. Тема 4. Основы программирования на языке Python История создания языка Python. Понятие о Python как динамически типизированном интерпретируемом языке программирования высокого уровня. Особенности синтаксиса Python. Предложение о стиле форматирования программного кода PEP8. REPL и исполнение записанного в файл программного кода. Краткий обзор средств разработки на Python. Понятие о синтаксисе Python. Встроенные типы данных. Условный оператор. Циклы. Операторы безусловного перехода. Встроенные коллекции в Python. Работа с файловой системой в Python. Функции. Элементы функционального программирования в Python. Понятие об объектно-ориентированном программировании в Python. Тема 5. Основы технологического обеспечения анализа данных Командная строка Linux. GNU coreutils. Распространённое ПО для работы на удалённых серверах. Средства загрузки веб-страниц и файлов (по протоколу HTTP). Системы управления версиями (git). Тема 6. Основы сбора, предварительной обработки и анализа данных в Python Библиотека numpy. Работа с разреженными матрицами с помощью scipy. Основы работы с табличными данными средствами pandas. Введение в работу с реляционными базами данных. Работа со структурированными/полуструктурированными данными в распространённых форматах.Регулярные выражения в Python. Библиотека scikit-learn, обзор решаемых задач. Построение цепочки обработки данных для решения задач предсказания. Библиотека nltk. Обзор решаемых библиотекой задач. Основная литература
Дополнительная литература
Образцы заданий к итоговому междисциплинарному экзамену Вариант 0. Разрешается пользоваться любой литературой. Запрещается списывать у коллег. Задание 1. Сравните алгоритм кластеризации k-means и алгоритмы иерархической кластеризации. Опишите, какие вычислительные проблемы имеют указанные алгоритмы и приведите примеры задач в которых предпочтительно применять каждый из алгоритмов. Задание 2. Для решения проблемы коллективного выбора предлагается следующее правило (правило Коупленда): для каждой пары альтернатив проводится парное сравнение по принципу большинства. Затем для каждой альтернативы вычисляется оценка Коупленда, определяемая как разность между числом альтернатив, проигравших данной альтернативе и числом альтернатив, выигравших у нее. Победителем считается альтернатива с наибольшей оценкой Коупленда. - Возможно ли, чтобы победитель Кондорсе и победитель Коупленда были двумя разными альтернативами? - Приведите пример, когда правило Коупленда и правило Борда дают разные результаты. Задание 3. Три города А,В и С решают вопрос о строительстве новой системы водоснабжения. Если города объединят свои усилия то строительство системы обойдется в с(АВС)=60 у.е. Каждому городу для строительства системы для себя необходимо с(А)=20, с(В)=20, и с(С)=50 у.е. Если города попарно объединяют усилия, то затраты на строительство системы для них будут с(АВ)=15, с(АС)=54, с(ВС)=54. - Постройте модель кооперативной игры и определите разумную функцию выигрыша (внимание, выигрыш не совпадает с затратами). - Найти крайние точки (вершины многогранника) ядра игры. Объяснить, как найденное ядро поможет сделать справедливый дележ общего выигрыша в случае, когда города решают объединить свои усилия. - Показать, что если в тех же условиях с(АВ)=12, то ядро состоит из одной точки. - Показать, что если в тех же условиях с(АВ)<12 (например с(АВ)=10), то ядро пусто. - Найти вектор Шепли справедливого дележа для всех трех случаев (ядро имеет более одной точки, ядро имеет одну точку, ядро пусто). - Какие затраты должен понести каждый участник в случае объединения усилий (для всех трех случаев)? Задание 4. Для набора данных "Титаник" (https://www.kaggle.com/c/titanic/data) постройте по крайней мере две различные модели предсказывающие выживание пассажира. Сравните построенные модели на отложенной выборке объемом 15% от всей выборки. Обе ваши модели должны превзойти бейзлайн решение, которое вам дано. Опишите процесс выбора модели и факторов. </12> |
Программа государственного итогового междисциплинарного экзамена... Программа предназначена для бакалавров четвертого курса направления подготовки 01. 03. 02 |
Образовательная программа высшего образования «Прикладная математика и информатика» Государственная итоговая аттестация выпускника по направлению подготовки бакалавров 01. 03. 02 Прикладная математика и информатика... |
||
Образовательная программа высшего образования «Прикладная математика и информатика» Государственная итоговая аттестация выпускника по направлению подготовки бакалавров 01. 03. 02 Прикладная математика и информатика... |
Программа дисциплины Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направлений 231300. 62 «Прикладная... |
||
Программа вступительного экзамена по математике и информатике для... Федеральное государственное бюджетное образовательное учреждение высшего образования |
Рабочая программа дисциплины «Информатика» (по гос «Информатика и программирование») Рабочая программа предназначена для преподавания дисциплины «Информатика» студентам очной полной формы обучения по направлению подготовки... |
||
Рабочая программа по дисциплине «Системное и прикладное программное... Рабочая пpогpамма составлена на основе на основании на основании решения кафедры «Вычислительная техника» Ульяновского государственного... |
Программа бакалавриата по направлению подготовки 01. 03. 02 «прикладная... Образовательная программа актуализирована для реализации в 2017-2018 учебном году на Ученом совете института |
||
Программа бакалавриата по направлению подготовки 01. 03. 02 «прикладная... Образовательная программа актуализирована для реализации в 2018-2019 учебном году на Ученом совете института |
Программа вступительных испытаний в магистратуру по направлению подготовки... «Прикладная информатика» на программу «Системы корпоративного управления» включает в себя междисциплинарный экзамен по направлению... |
||
Программа вступительных испытаний в магистратуру по направлению подготовки... «Прикладная информатика» на программу «Системы корпоративного управления» включает в себя междисциплинарный экзамен по направлению... |
Кафедра программных систем и баз данных Рабочая программа составлена на основании Государственного образовательного стандарта высшего профессионального образования по направлению... |
||
Программа дисциплины «Информатика и программирование» для направления... Программа дисциплины «Информатика и программирование» для направления 01. 03. 04 «Прикладная математика» подготовки бакалавров |
Программа дисциплины «Информатика и программирование» для направления... Программа дисциплины «Информатика и программирование» для направления 01. 03. 04 «Прикладная математика» подготовки бакалавров |
||
Программа итогового государственного междисциплинарного экзамена... Психология. Он предназначен для того, чтобы выявить степень теоретической и практической подготовленности выпускника к самостоятельному... |
Программа государственного экзамена по направлению 230101. 65 "Информатика... Программа государственного экзамена по направлению 230101. 65 "Информатика и вычислительная техника" по специализации "Вычислительные... |
Поиск |