Data Processing with Pandas and NumPy

This repository contains code and resources for data processing using the popular Python libraries pandas and NumPy. It demonstrates a variety of data wrangling techniques such as cleaning, transformation, integration, and exploratory analysis, useful for preparing data for analysis and machine learning tasks.

Project Overview

This project provides examples and exercises for handling data, focusing on:

Cleaning data by handling null values, duplicates, and inconsistent formats.
Transforming data for analysis, including normalization, encoding, and feature engineering.
Integrating data from multiple sources.
Exploring data through summary statistics and visualization.

The code in this repository is designed for beginners and intermediate users looking to strengthen their data preprocessing skills in Python.

Requirements

Python 3.x
Libraries:
- pandas
- NumPy
- Matplotlib (optional, for visualization examples)

Installation

To run the code in this repository, you need to have Python installed. Install the required libraries using:

pip install pandas numpy matplotlib
Usage
Each script in the repository focuses on a specific data preprocessing task, such as handling null values, merging data sets, and data exploration. To run a script, simply execute:


python script_name.py
Example
An example of data preprocessing in this repository includes:

Handling missing values: Fill null values with statistical measures or default values.
Data aggregation and grouping: Summarize data based on specific criteria.
Merging data sets: Combine data from multiple sources to enrich the data set.
Outlier detection: Identify and handle outliers using statistical methods.
Features
Data Cleaning: Handle missing values, duplicate data, and inconsistent formatting.
Data Transformation: Apply scaling, encoding, and feature engineering.
Data Integration: Merge and concatenate data sets to create a single unified view.
Exploratory Data Analysis (EDA): Summary statistics and basic data visualizations.
Examples
Here are some examples of tasks covered in the repository:

Filling missing values with mean values or default text.
Merging DataFrames to consolidate information from different sources.
Calculating statistics like mean, median, and standard deviation.
Visualizing data with histograms for an initial data overview.
Contributing
Contributions are welcome! If you would like to improve or expand this project, please open an issue or submit a pull request.

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
Data.csv		Data.csv
Data_ready		Data_ready
Exploratory_Univariate.py		Exploratory_Univariate.py
Import_exp.py		Import_exp.py
PCA.py		PCA.py
README.md		README.md
Z_score.py		Z_score.py
add_agrup.py		add_agrup.py
add_data.py		add_data.py
agrup.py		agrup.py
bivariate_analysis.py		bivariate_analysis.py
clusters_analysis.py		clusters_analysis.py
data_normalization.py		data_normalization.py
df_united.py		df_united.py
exercise1.py		exercise1.py
exercise2.py		exercise2.py
exercise_graph.py		exercise_graph.py
filtrar.py		filtrar.py
integration.py		integration.py
intro_matpl.py		intro_matpl.py
intro_seab.py		intro_seab.py
manip_datos.py		manip_datos.py
multivariate_analysis.py		multivariate_analysis.py
nulls_management.py		nulls_management.py
numpy_intro.py		numpy_intro.py
operaciones.py		operaciones.py
pearson.py		pearson.py
pract.py		pract.py
rename.py		rename.py
requirements.txt		requirements.txt
variable_transformation.py		variable_transformation.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Data Processing with Pandas and NumPy

Project Overview

Requirements

Installation

About

Uh oh!

Releases

Packages

Uh oh!

Languages

AlejandroLara11/Data-Preprocessing

Folders and files

Latest commit

History

Repository files navigation

Data Processing with Pandas and NumPy

Project Overview

Requirements

Installation

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages