R을 사용한 비즈니스 분석의 예측 분석 프로세스



이 블로그는 R을 사용한 Business Analytics의 예측 분석 프로세스에 대한 간략한 아이디어를 제공합니다.

자바에서 사전을 만드는 방법

일반적인 모델링 프로세스 :

일반적인 모델링 프로세스에서는 가설을 그리기 시작하는 것이 중요합니다. RFP (Request for Proposal)가 수신되고 가설이 도출됩니다.





  1. 올바른 데이터 소스 결정 – 여기서 고객은 데이터 소스를 제공 할 수 있지만 그렇지 않은 경우 데이터 소스를 찾아야합니다. 누가 선거에서 이길 것인지 평가하려는 시나리오가 주어지면 소셜 미디어, 뉴스 채널 또는 여론이 포함 된 소스로 데이터에 대한 공개 분석이 수행됩니다. 또한 문제를 분석하는 데 필요한 데이터의 양을 이해해야합니다. 이 경우 선거 케이스이므로 일반적으로 큰 샘플을 찾습니다. 반면에 헬스 케어에 대한 분석이 이루어지면 가설을 검증 할 사람을 충분히 확보하지 못할 가능성이 있기 때문에 많은 인구를 대상으로하기가 어렵다. 또한 데이터의 품질도 매우 중요합니다.
  2. 데이터 추출 – 예를 들어 인구 표본을 채취하면 고소득, 저소득, 연령, 노동 인구 (현장 / 현장), 거주자, NRI, 병원 보장 등과 같은 속성을 조사하여 연구를 시작할 수 있습니다. . 여기서 우리는 가설에 그렇게 많은 속성이 필요하지 않을 수도 있습니다. 우리는 고소득 및 저소득과 같은 속성이 누가 선거에서 이길 것인지 결정하는 데 기여하는 요인이 아닐 수 있음을 이해합니다. 그러나 나이는 투표 할 사람의 수를 직접 계산하므로 차이를 만들 수 있습니다. 자주 사용하지 않는 속성을 제외하거나 유용한 속성을 포함 할 수 있습니다. 두 경우 모두 잘못 될 수 있습니다. 이것이 분석이 어려운 이유입니다.
  3. 도구에 맞게 데이터 마사지 – 이는 모든 도구가 모든 데이터를 수용 할 수있는 것은 아니기 때문입니다. 특정 도구는 CSV 데이터 또는 Excel 데이터 만 허용합니다. 도구 부족은 도전입니다.
  4. 분석 실행 –이 작업은 다양한 분석 기법을 사용하여 수행 할 수 있습니다.
  5. 결론을 짓다 – 분석은 정확한 숫자를 제공합니다. 그러나 이러한 수치에서 결론을 도출하는 것은 사용자의 몫입니다. 예를 들어 10 % 또는 20 %라고한다면 그 의미를 이해해야합니까? 속성 A와 속성 B 사이의 상관 관계를 도출합니까?
  6. 결과 구현 – 비즈니스 결과를보기 위해 결론을 구현하는 것이 중요합니다. 예를 들어 다음과 같이 결론을 내릴 수 있습니다. ‘장마철에 우산을 사는 사람들’ 더 많은 비즈니스로 이어질 수 있습니다. 여기에서 우리는 우산을 상점에서 구할 수 있다는 결론을 내릴 필요가 있지만 관리 문제가 발생할 수 있습니다. 통계가 결과를 제공하는 순간 구현이 잘못 될 수 있습니다.
  7. 진행 상황 모니터링 – 마지막 단계 인 모니터링은 중요한 역할을합니다. 진행 상황을 모니터링하려는 조직이 많지 않기 때문에 모니터링이 잘못 될 수 있으며 이는 무시할 수있는 단계로 간주됩니다. 그러나 우리의 연구와 결론이 올바른 방향으로 가고 있는지 이해할 수 있으므로 모니터링이 중요합니다.

이 기사도 확인하십시오.' 상관 관계가 인과 관계를 의미하지는 않습니다. '분석가가 어떻게 잘못 될 수 있는지에 대한 통찰력을 제공합니다. 이 차트에서 주목해야 할 중요한 점은 실행 분석이 기계가 책임을지는 유일한 단계이며 궁극적으로 연구 수행 방법을 결정하는 인간에게 달려 있다는 것입니다.

질문이 있으십니까? 댓글 섹션에 언급하시면 다시 연락 드리겠습니다.



관련 게시물: