winsorization

Here are 10 public repositories matching this topic...

vahadruya / Capstone_Classification_Cardiovascular_Risk_Prediction

This project explores the Framingham Heart disease dataset with the objective to predict its risk in 10 years. Various methods for handling missing values and outliers are explored as iterations. After analysing the dataset, important and necessary features are selected. Seven ML models are implemented, with evaluation on the basis of Test Recall.

python sklearn pandas t-test classification trimming decision-trees smote random-forest-classifier knn-classifier shap heart-disease-prediction xgboost-classifier recall-score chi-squared-test knn-imputation winsorization shapiro regression-imputation

Updated Apr 7, 2023
Jupyter Notebook

zuhaib1214 / Feature-Engineering

Star

This repository is totally focused on Feature Engineering Concepts in detail, I hope you'll find it helpful.

standardization feature-engineering principal-component-analysis binarization z-score normalisation onehot-encoding simpleimputer ordinal-encoding labelencoder knn-imputer winsorization iterative-imputer percentile-method discritisation mean-median-imputation frequent-value-imputation

Updated Apr 7, 2023
Jupyter Notebook

Morano-git / WDBC-ML-Classification-Assignment

Star

Fundamentals of Machine Learning Assignment Repository

hyperparameter-optimization evaluation-metrics multicollinearity classification-algorithm supervised-learning-algorithms machinelearning-python yeo-johnson-transformations stratified-cross-validation winsorization robustscaler class-imbalance-handling

Updated Jun 8, 2025
Jupyter Notebook

srimallipudi / Estimating-Optimal-Cash-Levels-for-Firms-Using-SAS

Star

This comprehensive analysis delves into the crucial role of cash holdings in determining a firm's future performance and market dynamics.

data-transformation sas data-cleaning regression-analysis winsorization data-merging

Updated Mar 28, 2024
SAS

Parag000 / Customer-Churn-Prediction

Star

An end to end ML solution to predict customer churn, aiding businesses in identifying at-risk customers. This repository features a tuned LightGBM model, custom preprocessing, SMOTE for class balancing, and a user-friendly Streamlit app for predictions, emphasizing model optimization and deployment.

pipeline hyperparameter-tuning random-forest-classifier gridsearchcv streamlit smote-sampling lightgbm-classifier winsorization

Updated Nov 14, 2024
Jupyter Notebook

Imswappy / WinsorWeb

Star

Flask-based data science app for outlier detection, visualization, and cleaning. Implements Empirical Rule & Z-score for anomaly detection, interactive PDF plots with Plotly, and Winsorization for robust data preprocessing. Ideal for anomaly detection, data cleaning, and EDA workflows.

plotly eda outlier-detection data-cleaning scipy-stats winsorization

Updated Aug 31, 2025
HTML

Khushi130404 / Outlier_Exterminator

Star

Outlier_Exterminator is a Python tool for detecting and treating outliers using IQR, Z-Score, and Percentile methods. It supports trimming, capping, and Winsorization, demonstrated in a Jupyter Notebook.

machine-learning numpy trimming z-score iqr winsorization percentile-method capping

Updated Dec 27, 2024
Jupyter Notebook

JaviDoria / Upskilling-Machine-Learning

Star

- Fundamentos de Estadística matemática. - Conceptos clave de Machine Learning. - Desarrollo de modelos y Algoritmos. -Proceso EDA y preprocesamiento de datos. -Tratamiento de Outliers y NaN. -Estandarización y Codificación de características para un modelo. - Entrenamiento de Modelo de ML. -Desarrollo de una APP a partir de un modelo.

scikit-learn pandas logistic-regression label-encoder streamlit winsorization one-hot-encoder

Updated Jan 18, 2025
Jupyter Notebook

dare-afolabi / ab_test

Sponsor

Star

A self-contained A/B Test Pipeline for analyzing user-level experimental data.

python python-script t-test ab-testing statistical-modeling winsorization ancova-analysis

Updated Oct 30, 2025
Python

vrittigandhi / data_mining_project_22

Star

Predicting popularity of movies using the IMDb movies dataset with multiple regression algorithms such as XGBoost, Gradient Boosting, Regularization Regressors, and Stacking Regressor; Performed extensive data cleaning, feature engineering, and used transformation techniques such as winsorization and log-transformation

xgboost gradientboosting winsorization

Updated Mar 26, 2022
HTML

Improve this page

Add a description, image, and links to the winsorization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the winsorization topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

winsorization

Here are 10 public repositories matching this topic...

vahadruya / Capstone_Classification_Cardiovascular_Risk_Prediction

zuhaib1214 / Feature-Engineering

Morano-git / WDBC-ML-Classification-Assignment

srimallipudi / Estimating-Optimal-Cash-Levels-for-Firms-Using-SAS

Parag000 / Customer-Churn-Prediction

Imswappy / WinsorWeb

Khushi130404 / Outlier_Exterminator

JaviDoria / Upskilling-Machine-Learning

dare-afolabi / ab_test

vrittigandhi / data_mining_project_22

Improve this page

Add this topic to your repo