본문 바로가기
728x90
반응형

분류 전체보기179

[ADsP] 3.4 통계분석의 이해 통계 기초 용어 ■ 모집단과 표본 - 모집단, 모수 표본, 통계량 통계자료 획득 ■ 총 조사(=전수조사) vs 표본조사 - 전수조사 : 대상 집단을 모두 조사 -> 시간과 비용이 많이 소요. - 표본조사 : 모집단에서 일부만 추출하여 모집단을 분석(모수 추정). ■ 표본 추출 방법 - 단순랜덤추출 : 말 그대로 무작위 추출법. 모집단에서 각 개체가 표본으로 선택될 확률이 동일. - 계통추출 : 각 개체에 일련번호를 부여한 후, 일정한 간격으로 표본 추출. - 집락추출(군집추출) : 군집을 구분하고 군집별로 단순랜덤 추출. - 층화추출 : 각 계층을 고루 대표하는 표본을 단순랜덤 추출. ex) 성별, 나이대, 지역 등 ■ 척도 구분 - 명목척도 : 어느 집단에 속하는지 특성 분류 ex) 성별, 혈액형, 출.. 2023. 2. 23.
[ADsP] 3.3 데이터마트(R 심화) 데이터 마트(R 심화) ■ 데이터 마트 - 데이터 웨어하우스와 사용자 사이의 중간층에 위치 - CRM 관련 업무 중에서 핵심 ■ 변수 : 데이터 웨어하우스로부터 받아오는 데이터를 분석에 적절하게 처리 1) 요약변수 - 수집된 정보를 분석에 맞게 종합한 변수 - 많은 모델이 공통으로 사용될 수 있어 재활용성이 높음 2) 파생변수 - 사용자가 특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수 - 주관적일 수 있으므로 논리적 타당성을 갖추어 개발 - 세분화, 고객행동 예측, 캠페인 반응 예측에 매우 잘 활용됨 ■ 패키지 - 패키지 설치 : install.packages(‘패키지이름’) - 패키지 로드 : library(‘패키지이름’)/library(패키지이름) 1) reshape 패키지.. 2023. 2. 20.
[ADsP] 3.2 R 프로그래밍 R ■ R 소개 - 다양한 OS(운영체제)에서 사용할 수 있음 - 무료 오픈소스 소프트웨어 - 복잡한 통계분석 기법 가능 - S언어 기반의 프로그래밍 - 다양한 형태의 데이터 구조 지원 - 많은 패키지가 수시로 업데이트 - 커뮤니티 활발 ■ R 데이터 유형 1) 기본형 - Numeric : 정수, 실수, 복소수, 수학적 연산 및 통계 - Character : 문자, 단어로 구성. ex) "abc" - Logical : TRUE, FALSE 2) 구조형 - scalar, vector, matrix, array, factor 3) 복합형 : 서로 다른 타입의 데이터를 묶을 수 있음 - list, data.frame, data.table 4) Special Values - NULL : 변수 값이 초기화되지 않.. 2023. 2. 16.
[ADsP] 3.1 데이터 분석 기법의 이해 데이터 분석 기법의 이해 ■ 데이터 처리 - 데이터 분석은 통계지식과 복잡한 가정이 상대적으로 적은 분야 - 대기업은 DW(데이터 웨어하우스)나 DM(데이터 마트)을 통해 데이터를 가져와 사용 - 신규 시스템이나 DW에 포함되지 못한 경우, 기존 운영시스템(Legacy)이나 스테이징 영역(Staging Area)과 ODS(Operational Data Store)에서 데이터를 가져와 DW의 내용과 결합하여 활용 ■ 분석 기법 5가지 1. 시각화 - 가장 낮은 수준의 분석이지만, 복잡한 분석보다 효율적 - 빅데이터 분석, 탐색적 분석할 때 시각화는 필수 - SNA 분석에 활용 2. 공간분석(GIS) - 공간적 차원과 관련된 속성을 시각화하는 분석 - 지도 위 속성의 크기, 모양, 선 굵기 등 구분 3. 탐.. 2023. 2. 13.
[ADsP] 2.6 분석 거버넌스 체계 수립 분석 거버넌스 체계 수립 ■ 거버넌스 : 기업, 기관 등에서 규칙 및 규범이 구조화, 유지, 규제되고 책임지는 방식 및 프로세스 ■ 분석 거버넌스 : 기업에서 데이터 분석의 적용과 확산을 위한 관리방식이나 프로세스 ■ 분석 거버넌스 체계 구성요소 5가지 1) Organization : 분석 기획/관리 수행 조직 2) Process : 과제 기획/운영 프로세스 3) System : 분석 관련 시스템 4) Data : 데이터 5) Human Resource : 분석 교육/마인드 육성체계 * 분석 비용, 예산 X ■ 데이터 분석 수준 진단 1) 분석 준비도 : 분석 업무, 분석 인력 및 조직, 분석 기법, 분석 데이터, 분석 문화, 분석 인프라 분석 업무 파악 인력 및 조직 분석기법 · 발생한 사실 분석 업무.. 2023. 2. 12.
[ADsP] 2.5 분석 마스터 플랜 분석 마스터 플랜 수립 ■ 우선순위 고려 요소 : 3가지 기준을 고려해 적용 우선순위 결정 1. 전략적 중요도 : 전략적 필요성과 시급성으로 이루어짐 2. 비즈니스 성과/ROI(투자자본수익률) 3. 실행 용이성 : 투자 용이성과 기술 용이성으로 이루어짐 ■ 적용 범위/방식 고려 요소 : 3가지 기준을 고려해 분석(Analytics) 구현 로드맵 수립 1. 업무 내재화 적용 수준 2. 분석 데이터 적용 수준 3. 기술 적용 수준 ■ ISP(Information Strategy Planning) - 조직 내·외부 환경을 분석하여 기회나 문제점을 도출하고 사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 등 중장기 마스터 플랜을 수립하는 절차. - 전사적인 종합추진 계획 ■ 우선순위 평가 방법 및 .. 2023. 2. 12.
728x90
반응형