Apache Mahout의지도 학습



지도 학습은 학습 데이터의 레이블이 지정된 예에서 함수를 추론하는 기계 학습 기술입니다.

지도 학습은 훈련 데이터가 입력과 원하는 결과를 모두 포함하는 방법입니다. 예제로 시스템을 훈련시키는 것을 감독 학습이라고합니다. 또는 교사와 함께 알고리즘을 훈련하는 것도 감독 학습으로 취급 될 수 있습니다. 대상 변수에 대한 예측 변수가 모두있는 모든 샘플 데이터 또는 레이블이 지정된 데이터로 알고리즘을 훈련 한 후 알고리즘을 훈련하고 추가 분류를 위해 보이지 않는 예제를 사용할 수 있습니다.





Android의 활동 수명주기

Mahout의지도 학습의 몇 가지 중요한 기능은 다음과 같습니다.

  • 적절한 교육, 검증 및 테스트 세트 (Bok)의 구성이 중요합니다.
  • 이러한 방법은 일반적으로 빠르고 정확합니다.
  • 지도 학습 방법은 일반화 할 수 있어야합니다.
  • 새로운 데이터가 입력에 의해 제공 될 때 올바른 결과를 제공합니다.선험적표적.
  • 경우에 따라 올바른 결과 (목표)가 알려지고 학습 프로세스 중에 모델에 대한 입력으로 제공됩니다.

지도 학습의 예

미션을 훈련하고 싶고 레이블이 지정된 데이터와 함께 두 개의 서로 다른 이미지 그룹이 제공되는 경우 (예 : 위 그림에서 한 그룹에는 코끼리 이미지가 있고 다른 그룹에는 사자 이미지가 있습니다. 레이블이있는 데이터는 각 데이터 세트에 목표 값이 있음을 의미합니다. 위의 예에서 데이터 세트는 코끼리 이미지이고 레이블은 'Elephant'가 데이터 세트의 목표 값입니다. 이러한 레이블이 지정된 데이터 세트는 훈련 프로세스에 사용되므로 훈련 알고리즘이이 데이터 세트를 활용하고 일부 모델을 구축 할 수 있으며, 이는 레이블이 지정된 데이터 또는 대상 변수없이 보이지 않는 예를 분류하는 데 추가로 사용될 수 있습니다.



개체를 코끼리 또는 사자로 식별하는 데 도움이되는 기능을 식별 해 보겠습니다.

자바 스윙 사용 방법

특징 - 크기, 색상, 높이, 귀 크기, 몸통, 엄니

이것은 훈련 목적으로 사용될 기능 세트라고 부를 수 있습니다. 이 기능 세트는 최종 목표 변수에 영향을 미칩니다. 이러한 변수는 예측 변수 , 결정하는 데 도움이되기 때문에 최종 목표 변수 . 최종 변수는 레이블이라고도합니다. 최종 변수 여기는 코끼리 / 사자입니다.



table-word

이 예에서 범주, 크기, 색상, 키, 귀 크기, 몸통 및 엄니의 각 레코드는 예측 변수이고 Elephant와 Lion은 대상 변수입니다. 이러한 변수는 각각 학습 예제 및 학습 데이터 세트로 취급 할 수 있습니다.

mongodb 데이터베이스에 대한 사용자 생성

따라서지도 학습은 레이블과 함께 훈련하는 방법입니다. 여기서 알고리즘에 특정 기능을 추출하도록 요청하고,이를 기반으로 보이지 않는 예를 볼 때마다 알고리즘이이를 분류 할 수 있습니다. 올바른 수업으로.

질문이 있으십니까? 댓글 섹션에 언급하시면 다시 연락 드리겠습니다.

관련 게시물: