본문 바로가기
728x90
반응형

Certificate26

[ADsP] 1.8 데이터 사이언스와 데이터 사이언티스트 데이터 사이언스 ■ 데이터 사이언스의 정의 - 데이터로부터 의미 있는 정보를 추출해내는 학문. - 데이터와 관련된 모든 분야의 전문지식을 종합한 학문(총체적(holistic) 접근법). - 정형, 반정형, 비정형의 다양한 유형의 데이터를 대상으로 함. - 분석 뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정까지 포함한 포괄적 개념. ■ 다른 학문과의 차이점 데이터 사이언스 통계학 데이터 마이닝 분석 대상 정형, 비정형, 반정형 등 다양한 데이터 정형 데이터 분석 방법 분석 + 시각화 + 전달을 포함한 포괄적 개념 분석에 초점 학문 접근 종합적 학문, 총체적 접근법 ■ 데이터 사이언스의 핵심 구성요소 1. 분석 : 수학, 확률모델, 머신러닝, 분석학 등과 같은 이론적 지식. 2. IT : 프로그래밍, .. 2023. 2. 6.
[ADsP] 1.7 빅데이터의 열풍과 분석 전략 빅데이터의 열풍과 분석 전략 ■ 빅데이터 열풍과 회의론 - 빅데이터의 열풍이 일종의 거품현상이라고 판단하여 실제로 빅데이터 분석에서 찾을 수 있는 가치들을 놓칠 수 있다. ■ 산업별 분석 애플리케이션의 사례 - 금융 서비스 : 신용점수 산정, 사기 탐지, 고객 수익성 분석 - 소매업 : 재고 보충, 수요예측 - 제조업 : 맞춤형 상품 개발, 신상품 개발 - 에너지 : 트레이딩, 공급, 수요예측 - 온라인 : 웹 매트릭스, 사이트 설계, 고객 추천 ■ 빅데이터 분석, ‘Big'이 핵심이 아니다. - 데이터의 양이 아닌 유형의 다양성과 관련이 있음. 데이터에서 어떤 통찰을 얻을 수 있는지가 관건. ■ 전략적 통찰이 없는 분석의 함정 - 국소적인 문제 해결에 집중하지 말고 기업의 핵심 가치를 이끌어낼 수 있는.. 2023. 2. 5.
[ADsP] 1.6 빅데이터의 위기요인과 통제방안 빅데이터 시대의 위기 요인과 통제 방안 ■ 사생활 침해 ◽ 위기요인 : 개인정보를 다른 목적으로 사용하여 사생활 침해 발생. 데이터 익명화 기술의 발전이 필요함. ※ 개인정보 비식별 기술 (데이터 익명화 기술의 예) - 데이터 마스킹 : 홍길동 -> 홍** - 가명처리 : 홍길동 -> 임꺽정 - 총계처리 : 홍길동 170cm, 임꺽정 180cm, 이콩쥐 160cm -> 총 학생 키 합 510cm - 데이터 범주화 : 홍길동 35세 -> 홍씨 30 ~ 40세, 홍씨 30대 - 데이터 값 삭제 : 홍길동, 35세, 서울 거주, 한국대 졸업 -> 35세, 서울 거주 - 잡음 첨가(Noise 첨가) : 자료에 잡음(Noise)을 추가하여 변형을 주는 것. ◽ 통제요인 : 개인정보 사용을 제공자의 동의에서 사용자.. 2023. 2. 4.
[ADsP] 1.5 빅데이터 활용 빅데이터 활용 사례 ■ 기업 - 구글 : 검색엔진. - 월마트 : 구매 패턴 분석. - IBM 왓슨 : 의료 분야 활용. - 아마존 : 킨들(전자책 전용 단말기)에 쌓이는 전자책 읽기 관련 데이터 분석. ■ 정부 - 실시간 교통정보 활용, 치안을 위한 CCTV 활용 ■ 개인 - 가수 : 팬 음악청취 기록 분석. - 정치인 : 선거 승리를 위한 사회관계망 분석. 빅데이터 활용 기본 테크닉 7가지 ■ 연관규칙학습 : 변수들 간에 상관관계가 있는지 파악. ex) 우유를 구매하는 사람이 기저귀도 같이 구매하는가? 커피를 사는 사람이 탄산음료도 많이 사는가? ■ 유형분석 : 문서를 분류하거나 조직을 그룹으로 나눌 때 활용. ex) 사용자는 어떤 특성을 가진 집단에 속하는가? 온라인 수강생들을 특성을 파악하여 분류.. 2023. 2. 4.
[ADsP] 1.4 빅데이터의 이해 빅데이터의 이해 ◼ 빅데이터 : 기본적으로 방대한 양의 데이터를 의미. ◽4V : Volume(양), Variety(다양성), Velocity(속도), Value(가치). - Volume, Variety, Velocity는 투자비용 요소 / Value는 비즈니스 효과 요소. ◽빅데이터의 범주 - 데이터 변화(Volume, Variety, Velocity) -> 기술 변화(분석 기술) -> 인재, 조직 변화(Data Scientist 등의 인재 및 데이터 중심조직) ※ 빅데이터 분석 기술 - 클라우드 컴퓨팅 : 클라우드 컴퓨팅 기술이 빅데이터 분석에 경제성을 제공(출현 배경). - 하둡(Hadoop) : 여러 개의 컴퓨터를 하나인 것처럼 묶어 대용량 데이터를 처리하는 분산 처리 기술. - Apache Sp.. 2023. 2. 4.
[ADsP] 1.3 데이터베이스 활용 기업 내부 데이터베이스 솔루션 ◼ 시대별 ◽1980년대 - OLTP(On-Line Transaction Processing) : 데이터베이스의 데이터를 수시로 갱신하는 프로세싱. ex) 상품 주문, 재고관리, 회원 정보 수정 등 - OLAP(On-Line Analytical Processing) : 데이터 조회 위주. 다차원의 데이터를 대화식으로 분석. ◽2000년대 - CRM(Customer Relationships Management, 고객 관계 관리) : 고객과 관련된 내·외부 자료를 분석·통합해고객 중심 자원 극대화 -> 고객과의 지속적인 관계를 유지하여 더 높은 이익 창출. * 암기 : 고객이면 CRM. - SCM(Supply Chain Management, 공급망 관리) : 유통공급망에 참여하.. 2023. 2. 3.
728x90
반응형