W uczeniu maszynowym, cechy są indywidualnymi niezależnymi zmiennymi, które działają jak dane wejściowe w twoim systemie. Właściwie, podczas tworzenia przewidywań, modele używają takich cech do tworzenia przewidywań. I używając procesu inżynierii cech, nowe cechy mogą być również uzyskane ze starych cech w uczeniu maszynowym.
Aby zrozumieć w bardziej prosty sposób, weźmy przykład, gdzie można uznać, że jedna kolumna zbioru danych jest jedną cechą, która jest również znana jako „zmienne lub atrybuty”, a większa liczba cech jest znana jako wymiary. W zależności od tego, co próbujesz analizować, cechy, które uwzględniasz w swoim zbiorze danych, mogą się bardzo różnić.
Co to jest inżynieria cech w uczeniu maszynowym?
Inżynieria cech to proces wykorzystywania wiedzy o domenie danych do tworzenia cech, które sprawiają, że algorytmy uczenia maszynowego działają prawidłowo. Jeśli inżynieria cech jest wykonywana prawidłowo, pomaga poprawić moc przewidywania algorytmów uczenia maszynowego poprzez tworzenie cech przy użyciu surowych danych, które ułatwiają proces uczenia maszynowego.
Dlaczego cechy są ważne w uczeniu maszynowym?
Fektory w uczeniu maszynowym są bardzo ważne, ponieważ budują bloki zbiorów danych, jakość cech w twoim zbiorze danych ma duży wpływ na jakość wglądu, który uzyskasz podczas używania zbioru danych do uczenia maszynowego.
Jednakże, w zależności od różnych problemów biznesowych w różnych branżach, nie jest konieczne, aby cechy były takie same, więc tutaj musisz mocno zrozumieć cel biznesowy Twojego projektu data science.
Z drugiej strony, używając procesu „selekcji cech” i „inżynierii cech” możesz poprawić jakość cech Twoich zbiorów danych, co jest bardzo żmudnym i trudnym procesem. Jeśli te techniki działają dobrze, otrzymamy optymalny zbiór danych ze wszystkimi ważnymi cechami, które mając na uwadze nasz specyficzny problem biznesowy, prowadzą do najlepszego możliwego rozwoju modelu i najkorzystniejszej percepcji wizualnej.