Читать книгу Data Science. Практика онлайн


2. Регрессия:

* Linear Regression (линейная регрессия)

* Ridge Regression (линейная регрессия с регуляризацией)

* Lasso Regression (линейная регрессия с L1-регуляризацией)

* Polynomial Regression (полиномиальная регрессия)

* Support Vector Regression (регрессия с машиной опорных векторов)

* Decision Trees Regression (регрессия с деревом решений)

* Random Forests Regression (регрессия с случайными лесами)


3. Кластеризация:

* K-Means Clustering (кластеризация методом k-средних)

* Hierarchical Clustering (иерархическая кластеризация)

* DBSCAN (кластеризация с плотностью)


4. Дименсиональное сокращение:

* Principal Component Analysis (анализ главных компонент)

* Linear Discriminant Analysis (линейный дискриминантный анализ)

* t-SNE (t-Student стохастическая близость смещением и растяжением)


5. Избирательное обучение:

* Recursive Feature Elimination (рекурсивное удаление признаков)

* SelectKBest (выбор K лучших признаков)

* Lasso/Ridge Regression Feature Selection (выбор признаков с помощью линейной регрессии с L1/L2-регуляризацией)


6. Оценка моделей:

* Cross-Validation (перекрёстная проверка)

* Grid Search (поиск по сетке)

* Randomized Search (рандомизированный поиск)

* Learning Curve (график обучения)


Scikit-learn


1. Предобработка данных:

* Функции для нормализации и стандартизации данных

* Функции для обработки пропущенных данных

* Функции для кодирования категориальных переменных

* Функции для выборки данных


2. Извлечение признаков:

* Функции для извлечения текстовых признаков, такие как CountVectorizer и TfidfVectorizer

* Функции для извлечения признаков из изображений, такие как Histogram of Oriented Gradients (HOG) и Local Binary Patterns (LBP)

* Функции для извлечения признаков из аудио, такие как Mel-frequency cepstral coefficients (MFCC) и Chroma features


3. Оценка моделей:

* Функции для оценки качества моделей, такие как accuracy\_score, precision\_score, recall\_score, f1\_score и roc\_auc\_score

* Функции для визуализации результатов классификации, такие как confusion\_matrix, classification\_report и ROC curves