Python'da test veri setleri scikit-learn ile nasıl oluşturulur?

in #utopian-io7 years ago (edited)

In this tutorial, you will discover test problems and how to use them in Python with scikit-learn.

A. How to generate multi-class classification prediction test problems.
B. How to generate binary classification prediction test problems.
C. How to generate linear regression prediction test problems.

Bu yazıda test problemlerini ve bunları Python'da scikit-öğrenimiyle nasıl kullanacağınızı keşfedeceksiniz.

A. Çok sınıflı sınıflandırma tahmin testi problemleri nasıl üretilir
B. İkili sınıflandırma tahmini test problemleri nasıl üretilir.
C. Doğrusal regresyon tahmini test problemleri nasıl üretilir.

Needs are;
A.scikit-learn software
B. Python Instructions

Gereksinimler ise;
A. scikit-learn yazılımı
B. Python Komutlar

The difficulty level of commands we use is middle.
Kullanacağımız komutların zorluk derecesi orta

Test veri kümeleri, bir makine öğrenme algoritmasını veya test koşum takımı kullanmanıza izin veren küçük tasarlanmış veri setleridir.

Test veri kümelerindeki veriler, belirli algoritma davranışını keşfetmenize olanak tanıyan doğrusal veya doğrusal olmayan gibi iyi tanımlanmış özellikleri barındırır.Scikit-learn Python kütüphanesi, sınıflandırma için konfigüre edilebilir test problemlerinden örnekler üretmek için bir dizi fonksiyon sunar.

Bu yazıda test problemlerini ve bunları Python'da scikit-learn ile nasıl kullanacağınızı öğreneceksiniz...

Bu eğitimi tamamladıktan sonra şunları öğreneceksiniz:

  • Çok sınıflı sınıflandırma tahmin testi problemleri nasıl üretilir.
  • İkili sınıflandırma tahmini test problemleri nasıl üretilir.
  • Doğrusal regresyon tahmini test problemleri nasıl üretilir.

Başlayalım...

Bu eğitim üç bölümden oluşmaktadır;

  • Test Veri Setleri
  • Sınıflandırma Testi Sorunları
  • Regresyon Test Problemleri

Test Veri Setleri

Makine öğrenme algoritmalarını geliştirirken ve uygulamakta karşılaşılan bir sorun olduğunda bunları doğru bir şekilde uygulayıp uygulamadığınızı nasıl anlarsınız.
Test veri kümeleri, algoritmalarınızı ve test kablolarınızı test etmenize ve hata ayıklamanıza izin veren küçük, yapmacık problemlerdir. Ayrıca, hiper parametrelerin değişimlerine yanıt olarak algoritmaların davranışını daha iyi anlamak için de yararlıdırlar.

Aşağıda, test veri kümelerinin bazı istenen özellikleri verilmiştir:

  • Hızlı ve kolay bir şekilde üretilebilirler.
  • Tahminleri karşılaştırmak için "bilinen" veya "anlaşılmış" sonuçlar içerir.
  • Bunlar stokastik olup, her seferinde aynı problem üzerinde rasgele değişiklikler yapılmasına izin verirler.
  • Bunlar küçüktür ve kolayca iki boyutta görüntülenirler.
  • Ölçeklendirilebilir.

Yeni bir makine öğrenme algoritması kullanmaya başlarken veya yeni bir test koşum takımı geliştirirken test veri kümelerini kullanmanızı öneririm.

scikit-learn, bir takım test problemleri üretmek için fonksiyonlar sağlayan, makine öğrenimi için kullanılan bir Python kütüphanesi.

Sınıflandırma Testi Sorunları

Bu bölümde, üç sınıflandırma sorununa bakacağız: blobs, moons and circles.

Blobs Sınıflandırma Sorunu

Make_blobs () işlevi, bir Gauss dağılımı noktalarında blobs oluşturmak için de kullanılabilir.
Kaç tane blobun üretileceğini ve örnek sayısını ve diğer özelliklerinin birçoğunu kontrol edebilirsiniz.
Problem, blob ların doğrusal olarak ayrılabilir doğası göz önüne alındığında doğrusal sınıflandırma problemleri için uygundur.

Aşağıdaki örnek, çok sınıflı sınıflandırma tahmini problemi olarak üç tane blob içeren 2D veri seti üretir. Her gözlemin iki girişi ve 0, 1 veya 2 sınıf değeri vardır.

generate 2d classification dataset
X, y = make_blobs(n_samples=100, centers=3, n_features=2)

Örneği çalıştırmak, sorunun girişlerini ve çıktılarını üretir ve sonra farklı renkleri kullanarak farklı sınıflar için puanları gösteren kullanışlı bir 2B çizim oluşturur.

Belirli veri setiniz ve elde edilen arsa, problem oluşturucunun stokastik doğasına göre değişir. Bu bir özelliktir, bug değildir.


Blob Dağılım Plakası Test Sınıflandırma Sorunu

Bu örnek yapıyı aşağıdaki örnekler için kullanacağız.

Moon Sınıflandırma Sorunu

Make_moons () işlevi, ikili sınıflandırma ve bir girdap paterni, ya da iki moon üretecektir.
moon şekillerinin ne kadar rahatsız edici olduğunu ve üretilecek örnek sayısını kontrol edebilirsiniz.

Bu test problemi, doğrusal olmayan sınıf sınırlarını öğrenebilen algoritmalar için uygundur.

Aşağıdaki örnek bir moon veri kümesi üretir.

generate 2d classification dataset
X, y = make_moons(n_samples=100, noise=0.1)

Örnek çalıştırıldığında, incelenmek üzere veri kümesini üretir ve çizer, örnekleri atanan sınıflarına göre yeniden renklendirir.


Aylık Test Sınıflama Probleminin Saçılım Haritası

Circles(daireler) Sınıflandırma Sorunu

Make_circles () işlevi, eşmerkezli dairelere giren veri kümeleri ile ikili bir sınıflandırma sorunu oluşturur.

Yine, moon test probleminde olduğu gibi, şekillerdeki gürültünün miktarını kontrol edebilirsiniz.
Bu test problemi karmaşık doğrusal olmayan manifoldları öğrenen algoritmalar için uygundur.

Aşağıdaki örnek, biraz gürültülü bir daire veri kümesi oluşturmaktadır.

generate 2d classification dataset
X, y = make_circles(n_samples=100, noise=0.05)


Örneği çalıştırmak veri kümesini üretir ve çizer.


Dairelerin Saçılım Plotu Test Sınıflandırma Problemi

Regresyon Test Problemleri

Regresyon gözlemi verilen miktarın tahmin sorundur.

Make_regression () işlevi, giriş ve çıkışlar arasında doğrusal bir ilişki ile bir veri kümesi oluşturur.

Örneklerin sayısını, girdi özelliklerinin sayısını, gürültü seviyesini ve çok daha fazlasını yapılandırabilirsiniz.
Bu veri kümesi doğrusal regresyon fonksiyonunu öğrenen algoritmalar için uygundur.

Aşağıdaki örnek, bir giriş özelliği ve az gürültülü(noise) bir çıkış özelliği ile 100 örnek oluşturacaktır.

generate regression dataset
X, y = make_regression(n_samples=100, n_features=1, noise=0.1)


Örneği çalıştırmak veriyi üretir ve doğrusal olduğu düşünüldüğünde X ve Y ilişkisini çizer


Regresyon Testi Problemi Dağılım Plotu

Bu yazıda, test problemlerini keşfettiniz ve bunları Python'da scikit-learn ile nasıl kullanılacağını öğrendiniz.

Özellikle, öğrendim:

Çok sınıflı sınıflandırma tahmin testi problemleri nasıl üretilir.
İkili sınıflandırma tahmini test problemleri nasıl üretilir.
Doğrusal regresyon tahmini test problemleri nasıl üretilir.

Sormak istediğiniz bir şey var mı?



Posted on Utopian.io - Rewarding Open Source Contributors

Sort:  

Your contribution cannot be approved because it does not follow the Utopian Rules, and is considered as plagiarism. Plagiarism is not allowed on Utopian, and posts that engage in plagiarism will be flagged and hidden forever.

You can contact us on Discord.
[utopian-moderator]