업종별 콘텐츠 / 일반기업

[상위1% 빅데이터] 기업이 주목하는 Hadoop 제대로 배우기

[상위1% 빅데이터 ] 기업이 주목하는 Hadoop 제대로 배우기

과정 소개

제작: 2024년 11월NCS: 20010304:빅데이터운영·관리

IT 대기업, 소셜 미디어 서비스 등에서 빅데이터 분석 및 처리에 하둡(Apache Hadoop)을 앞다투어 사용하고 있습니다. 하둡은 대량의 자료를 적은 비용으로 수집 및 가공처리할 수 있도록 만들어진 자바(Java) 언어 기반의 프레임워크로, 대규모 데이터 세트를 분산 저장하고 처리해 줍니다.

기업들은 데이터 분석을 통해 새로운 시장을 개척하고 희소성있는 가치를 부여하며, 소비자들에게 필요한 정보를 적기에 제공할 수 있게 될 겁니다. 중소기업 또한 빅데이터는 꼭 다뤄야 할 필수 사항인 만큼, 빅데이터 관련 직무로 취업/이직을 꿈꾸는 분들께는 희소식이 아닐 수 없습니다.

강의 대상

하둡 프로그래밍를 처음 접하시는 학습자

학습내용의 용어, 수행방법 등에 대한 기본기를 탄탄히 다지고 싶으신 학습자

이론 내용을 실무와 함께 습득하고 싶으신 학습자

강의 목표

빅데이터 용어에 대한 이해를 시작으로 HDFS, YARN 을 통한 하둡(Hadoop)의 Map Reduce 연산의 구현으로 빅 데이터를 다루는 과정을 직접 체험한다.

빅데이터 테크놀로지 (Big Data Technology) 중 데이터 수집/가공분야를 이해하게 되며, 이 과정이 결국은 빅데이터 분석가가 될 수 있다.

학습 내용

  1. 섹션 1
    1. Hadoop, HDFS 그리고 YARN
    2. Linux 설치 및 환경설정
    3. Hadoop 설치
    4. Hadoop 실행 및 HDFS 명령어
  2. 섹션 2
    1. Map Reduce를 이용한 Word count 구현 1
    2. Map Reduce를 이용한 Word count 구현 2
    3. CDC COVID-19 데이터를 이용한 월별 확진자 통계 1
    4. CDC COVID-19 데이터를 이용한 월별 확진자 통계 2
  3. 섹션 3
    1. CDC COVID-19 데이터를 이용한 연령별 확진자 통계
    2. 사용자 정의 옵션 사용 1
    3. 사용자 정의 옵션 사용 2
    4. 사용자 정의 카운터 구현 1
  4. 진행평가
    1. 진행평가 응시하기
  5. 섹션 4
    1. 사용자 정의 카운터 구현 2
    2. MultipleOutputs 구현
    3. 사용자 정렬 구현 1
    4. 사용자 정렬 구현 1
  6. 섹션 5
    1. HIve 소개 및 설치
    2. HiveQL을 이용한 Map Reduce 연산 1
    3. HiveQL을 이용한 Map Reduce 연산 2
    4. Hive Java Client
  7. 시험
    1. 설문 조사 / 수강 후기
    2. 시험 응시하기
  8. 과제
    1. 과제 응시하기

교강사

훈련 비용

기본 훈련 비용
가 격83,600 원

과정 후기

교재
이 과정은 지정된 교재가 없습니다.