R을 사용한 비즈니스 분석의 모델링 기법



이 블로그는 R을 사용한 비즈니스 분석의 모델링 기술에 대한 간략한 소개를 제공합니다.

다양한 모델링 기법 :

문제를 더 작은 프로세스로 나눌 수 있습니다.





분류 – 데이터를 분류하는 곳입니다. 예 : 질병 모든 질병은 특정한 행동을 보이고 우리는 그것들을 더 분류 할 수 있습니다.

예 : 면역력을 저하시키는 질병, 두통을 유발하는 질병 등



회귀 – 여러 변수 간의 관계를 알아내는 것을 포함합니다.

예 : 인간의 몸무게와 키의 관계

Anomoly발각 – 기본적으로 변동입니다.



예 : 고전압 또는 저전압의 경우.

또 다른 예는 국가에 따라 오른쪽 또는 왼쪽에서 운전하는 규제 된 행동을 포함 할 수 있습니다. 여기서 변칙성은 반대편에서 운전하는 사람입니다.

또 다른 예로는 네트워크 침입이 있습니다. 여기에서 인증 된 사용자가 귀사의 웹 사이트에 로그인 한 다음 인증되지 않은 누군가가 로그인하면An0moly.

속성 중요성 – 기본적으로 키, 몸무게, 체온, 심박 등 여러 속성을 제공합니다. 주목할 점은 이러한 모든 속성이 작업에 중요하다는 것입니다.

예를 들면 다음과 같습니다. 누군가 사무실에 도착할 시간을 예측하려고합니다. 각 속성은 중요한 역할을하지만 모든 속성이 중요한 것은 아닙니다.

협회 규칙 – 간단히 말하면 추천 엔진을 중심으로 진행되는 다음 동작을 분석하거나 예측하는 것입니다.

예 : 빵을 사는 사람도 우유를 살 수 있습니다. 과거의 쇼핑 행동을 분석하면 장바구니의 모든 항목이 관계가 있습니다. 이 경우 빵을 사는 사람도 우유를 살 확률이있을 수 있습니다.

클러스터링 – 통계에서 가장 오래된 기법 중 하나입니다. 실제로 분류 또는 클러스터링과 같은 문제를 항상 모델링 할 수 있습니다. 즉, 유사한 엔티티를 그룹화하는 것을 의미합니다.

예를 들면 :

1) 사과와 오렌지 바구니를 가져 가면 사과와 오렌지를 분리 할 수 ​​있습니다.

2) 클러스터링의 중요한 사용 사례는 의료입니다. 거의 모든 통계 및 분석은 의료 사용 사례에서 시작되었습니다. 더 깊이 들어가기 위해 코호트 (유사한 질병을 가진 사람)라는 클러스터링 용어가있어 기존 고객과 별도로 연구 할 수 있습니다. 예를 들어 10 명이 열이 나고 또 10 명이 두통을 앓고 있다면 그들 사이의 공통점을 찾아서 약을 만들 것입니다.

특징 추출 – 특징 추출 정확도에서 유효성과 실패는 상당히 관련이 있습니다. 즉, 특징 추출은 패턴 인식이라고 할 수 있습니다.

예를 들면 :

Google 검색에서 사용자가 용어를 입력하면 결과가 나타납니다. 이제 질문해야 할 중요한 질문은 어떤 페이지가 용어와 관련이 있고 관련이 없는지 어떻게 알았습니까? 이것은 특징 추출 및 패턴 인식으로 대답 할 수 있으며, 여기에 두드러진 특징을 추가합니다. 사진이 주어지고 특정 카메라가 얼굴을 감지하고 얼굴을 강조 표시하여 아름다운 이미지를 제공하며 기능 인식도 사용한다고 가정 해 보겠습니다.

지도 학습 vs 비지도 학습

에) 예측 범주 – 기술에는 회귀, 로지스틱, 신경망 및 의사 결정 트리가 포함됩니다. 몇 가지 예로 사기 감지 (컴퓨터가 이전 사기 이력에서 다음 사기를 학습하고 예측하는 위치)가 있습니다. 비지도 학습에서는 과거 데이터가 없기 때문에 예제로 예측할 수 없습니다.

비) 분류 카테고리 – 거래가 사기인지 아닌지 예를 들어 분류 범주에 들어갑니다. 여기에서 과거 데이터를 가져와 의사 결정 트리로 분류하거나, 과거 데이터를 전혀 가져 오지 않은 경우 데이터에서 직접 시작하여 자체적으로 기능을 활용하려고합니다. 예를 들어, 조직을 떠나거나 남을 가능성이있는 직원을 알아야하는 경우입니다. 과거 데이터를 사용할 수없는 새로운 조직인 경우 데이터 추출을 위해 항상 클러스터링을 사용할 수 있습니다.

자바에서 스캐너 클래스 사용

씨) 탐사 카테고리 – 이것은 빅 데이터가 의미하는 바를 떠올리게하는 간단한 방법입니다. 비지도 학습에서는 기본 구성 요소 및 클러스터링이라고합니다.

디) 선호도 카테고리 – 여기서 교차 판매 / 상향 판매, 시장 바구니 분석과 같은 여러 요소가 관련됩니다. 바구니 분석에는 기록 데이터가 없기 때문에지도 학습이 없습니다. 따라서 데이터를 직접 가져와 연관성, 시퀀싱 및 요인 분석을 찾습니다.

질문이 있으십니까? 댓글 섹션에서 언급하시면 다시 연락 드리겠습니다.

관련 게시물: