Yosemite El Capitan

Öz Nitelikleri daha küçük bir alt kümeye ayrıştırmak için birçok teknik vardır. Bu yöntemler, keşif amaçlı veri analizi, görselleştirme, tahmine dayalı modeller oluşturma veya kümeleme problemleri için oldukça faydalı olabilmektedir. Bu yazıda, boyut azaltma için Temel Bileşen Analizini (PCA) ele alacağız. Yazıda, hemen her yerde bulabileceğiniz kod örneklerinden ziyade konunun matematiksel temellerine değinilmiştir.

Temel Bileşen Analizi altında yatan ana fikir, birbiriyle ilişkili birçok değişkenden oluşan bir veri setinin boyutsallığını, veri setinde mevcut varyasyonu maksimum ölçüde korurken azaltmaktır. Orijinal verilerin aynı sayıda veya daha az boyutta bir projeksiyonunu hesaplamak için lineer cebir ve istatistiksel bazı basit matris işlemlerini kullanan bir yöntemdir.


El Capitan glows in the early morning light in Yosemite National Park, California (source)

There are many techniques to decompose features into a smaller subset. This can be useful for exploratory data analysis, visualization, making predictive models or clustering. In this tutorial, you will discover the Principal Component Analysis for dimensionality reduction.

The main idea of Principal Component Analysis (PCA) is to reduce the dimensionality of a data set consisting of many variables correlated with each other while retaining the variation present in the dataset, up to the maximum extent. …

Adem T.

Data Scientist

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store