빅데이터 머신러닝(자바,파이썬) 프로젝트 전문가 과정

빅데이터 머신러닝(자바,파이썬) 프로젝트 전문가 과정

교육기간

23.01.11 ~ 23.06.30

정원

24명

교육 방법

오프라인

훈련비

전액지원

훈련참여수당

월 최대 81만 6천원

디지털 핵심 실무인재 양성훈련(K-Digital Training)은 누구를 위한 코스인가요?

미래융합교육원에서  AI, 빅데이터, 클라우드 등 디지털ㆍ신기술 분야 교육을 통해 ‘미래형 핵심 실무인재’로 협력기업 등으로 취업을 희망하는 자
지원대상은 대학 졸업자(졸업예정자) 등 구직자 (청년 구직자 중심)로 국민내일배움카드를 발급 받아서 지원을 받을 수 있습니다.  

빅데이터 개요

4차 산업혁명 시대 인공지능, 사물인터넷, 무인자동차, 로봇산업 등 모든 것이 연결되고 보다 지능적인 사회에 우리는 살고 있습니다.
AI 시대를 맞아 빅데이터가 인공지능 분야에 생명력을 불어넣는 가장 중요한 기술로 자리매김하였다. 넷플릭스, 스타벅스, 아마존, 자라 등 많은 기업들이 빅데이터를 활용하여 매출 증대 및 고객만족도를 높이는데 기여하였고 해외 뿐 아니라 국내 병원 진료, 버스 노선 구축, 교통관제시스템, 범죄 예방 시스템 등 많은 분야에 활용되고 있습니다.  

훈련목표

본 과정은 대전인적자원개발위원회 인력공급수요 파악을 토대로 기업인터뷰, FGI 등을 통해 기업체의 핵심기술이 과정안에 포함 되어 있습니다.  
훈련목표는 다음과 같습니다.  
1. 프로그래밍 언어를 활용한 응용SW개발기술을 보유할 수 있다.  
2. 빅데이터 분석 및 시각화 구현 기술을 보유할 수 있다.  
3. 데이터 마이닝 기법을 통해 통계분석, 감정분석, 정형/비정형 데이터 분석을 진행할 수 있다.  
4. 빅데이터 머신러닝과 AI 딥러닝을 이용하여 AI기반 데이터 분석 및 개발 능력을 갖출 수 있도록 한다.  

훈련대상

교육특징 및 혜택

1. 매월 훈련수당 및 국민취업제도를 통해 월 최대 81만 6천원을 지원 받을 수 있습니다.  
2. 기업실무자 프로젝트 멘토링 참여  
3. 훈련교재 무상지급 (OpevCV, 파이썬 입문, R코딩 & 데이터분석, 자바 웹을 다루는 기술, 파이썬 웹 개발의 정석, AI 수학 등)  
4. 우수훈련생 협력기업 취업연계 서비스  

커리큘럼

○ 프로그래밍 (Python)

  ● 자바, 파이썬, C, C++, C# 외에도 프로그래밍 언어의 종류는 다양합니다. 여러 프로그래밍 언어 중 크게 두 분류로 나누자면 절차지향 프로그래밍 언어와 객체지향 프로그래밍 언어로 나눌 수 있습니다. 개발하고자 하는 소프트웨어가 구동되는 운영체제 및 플랫폼에 따라 적합한 개발 언어를 선택합니다.  해당 과정에서는 자바와 파이썬 언어를 학습하게 됩니다.
     - 파이썬 개요
     - 파이썬 개발 환경 설정
     - 기초 자료형
     - 데이터형 관련 함수
     - 제어문
     - 반복문
     - 함수
     - 내장함수
     - 사용자 입출력
     - 파일 읽고 쓰기
     - 클래스
     - 패키지
     - 예외처리

○ 프로그래밍 (JAVA)

  ● 웹개발, 알고리즘 개발, 데이터 마이닝, 머신러닝 등 전문기술 수행 이전에 필요한 파이썬, 자바 프로그래밍 기본문법에 대해 학습합니다.
     - 자바 개요
     - 자바 개발 환경 설정
     - 이클립스 기본 사용법
     - 자바 자료형
     - 제어문
     - 객체지향 프로그래밍 개념
     - 클래스
     - 메소드
     - 상속
     - 인터페이스
     - 패키지
     - 쓰레드

○ 빅데이터 수집과 데이터 검증

  ● 빅데이터 분석에 필요한 데이터를 내·외부에서 수집하고 추출, 정제, 변환, 검증하여 데이터 분석에 필요한 형태로 수집할 수 있도록 학습합니다.

     - 빅데이터 활용 기술 개요(수집/저장관리/처리/분석/시각화)
     - 데이터 유형분류 (정형, 반정형, 비정형)
     - 데이터 유형에 따른 수집 기술
     - 데이터 전처리 작업(데이터 정제 및 변환)
     - 데이터 추상화 및 검증
     - 분석용 데이터 셋

○ 웹 크롤링, 웹 스크래핑

  ● Selenium 라이브러리, beutifulsoup4 라이브러리를 활용하여 파이썬 IDE에서 라이브러리를 Import하고 라이브러리 내부 클래스 및 함수 활용 방법을 학습합니다.

  ● 라이브러리를 활용하여 웹 페이지 컨텐츠의 파싱 및 크롤링 작업을 진행하는 방법을 학습합니다.

○ 데이터 마이닝 및 분석

  ● 데이터 마이닝을 통해 얻은 유효한 데이터를 개발자와 사용자의 목적에 맞는 유의미한 데이터로 정제하여 사용자의 인사이트에 활용할 수 있는 데이터를 분석하는 과정입니다.

  ● 대표적인 데이터 분석 라이브러리로는 numpy와 pandas가 있습니다.

  ● Numpy라이브러리를 활용하여 array형태의 데이터 형태를 구축할 수 있으며, 이는 기존의 리스트 방식의 데이터 형태보다 수십배 빠른 연산속도를 지녀, 대량의 데이터를 분석하는 작업에 필수적으로 활용됩니다.

○ 빅데이터 분석 및 분석사례

  ● 빅데이터 분석에 필요한 데이터를 내·외부에서 수집하고 추출, 정제, 변환, 검증하여 데이터 분석에 필요한 형태로 수집할 수 있도록 학습합니다.

     - 빅데이터 분석기법(분류분석/군집분석/회귀분석/연관분석/감정분석) 이해
     - 빅데이터 분산 및 취합 처리 이해(Hadoop[Map/Reduce])
     - 텍스트 마이닝 기법, 텍스트 문장 형태소 분석, 텍스트 추출 및 처리방법
     - 감정분석, 통계분석, 정형 비정형 데이터 분석 모델 기획 및 결합
     - 자연어 처리 및 분석사례
     - 디자인 방법론과 비즈니스 분석과 프로세스를 이용한 빅데이터 비즈니스 모델
     - 빅데이터 전략 경영 사례

○ 데이터 시각화

  ● 데이터 분석 과정에서 얻어낸 데이터를 정제하고 변경하여 데이터베이스를 통한 마케팅 전략을 구축하거나 통계적인 품질 관리를 수행할 수 있습니다.

  ● Matplotlib 라이브러리에서 제공하는 다양한 시각화 도구를 활용하여 바 차트, 히스토그램, 파이 차트 등의 형태로 데이터를 시각적으로 표현하는 방법을 학습합니다.

     - 빅데이터 시각화 방법 및 요소 구현(차트, Figures, 플롯, Maps 등)
     - 빅데이터 시각화 Tools 소개 (R, Tableau, Google Data Studio, Microsoft Power BI)
     - Open API 활용을 통한 빅데이터 시각화
     - 통계분석도구를 활용한 빅데이터 시각화
     - 비정형데이터 시각화 기법

○ 데이터처리 기초 및 클라우드 컴퓨팅

  ● 데이터베이스 구축은 데이터를 저장하기 위해 DBMS에 데이터베이스 모델을 생성하는 것을 뜻합니다.

  ● 데이터베이스를 구축하려면 ERD, 테이블 정의서, 인덱스 정의서, 뷰 정의서의 산출물을 기반으로 요구사항분석, 개념적 설계, 논리적 설계, 물리적 설계, 데이터베이스 구축의 단계를 거칩니다.

  ● 위 과정을 통해 생성된 데이터베이스를 대상으로 명령어를 활용하여 운용합니다.

     - 데이터 처리를 위한 Python 프레임워크 개발환경 구축(Django, Flask)
     - DBMS 설계 및 모델링, 구현
     - SQL 활용 및 응용
     - NoSQL Databases
     - Data Algorithm(Data Structure / Priority Queue / Hash Table / Stack / List / Graph Theory)
     - 클라우드 컴퓨팅 서비스의 종류와 특성
     - Google Cloud, IBM Cloud, AWS 서비스 범위 및 소개
     - AWS 컴퓨팅/네트워킹/스토리지/DB/분석/애플리케이션 서비스 구축

○ 영상처리

  ● 웹 캠을 통한 실시간 영상 데이터 혹은 이미지 파일을 통해 이미지 내에 객체를 트래킹하여 객체를 추적하고 이미지에서 특정 부분에 대한 이미지 처리방법을 학습합니다.

  ● 영상 데이터의 경계선 검출 방법을 학습합니다.

  ● 푸리에 변환, 노이즈 제거, 맵핑 구현 방법을 학습합니다.

  ● 트리 기반 객체 검출 기법을 학습합니다.

  ● 머신러닝에서의 영상처리 기법으로 바이너리 의사 결정 트리, 부스팅, 랜덤 트리, K-최근접 이웃(KNN), SVM(서포트 벡터 머신)을 학습합니다.

     - 컴퓨터 비전 개요
     - OpenCV 라이브러리의 이해
     - OpenCV를 활용한 영상 인식 및 처리
     - 경사하강, 역전화, 활성화함수, 일반화, 정규화
     - 합성곱신경망(CNN)
     - 순환신경망(RNN), LSTM, GAN
     - 모델컴파일 (손실함수, 옵티마이저,평가매트릭스이해)
     - TensorFlow/Keras 주요 모듈 및 분석 API 이해
     - 객체인식, 얼굴검출/인식, 성별/나이 인식, 사람/차량 계수, 도난객체탐지

○ 빅데이터 프로젝트

   ● 제시된 프로젝트를 2개월 동안 수행, 개발함으로서 실전 프로그래밍 감각을 익히고 관련 기업으로의 채용연계, 취업을 돕습니다.

   ● 데이터베이스를 활용한 고객 관리 CRM 소프트웨어를 개발합니다.

   ● 컴퓨터비전 (OpenCV) 기술을 활용한 품질관리시스템을 개발합니다.

   ● 스마트시티(SmartCity)에 활용가능한 범죄 예방 시스템 관련 SW, APP 등을 개발합니다.

취업진로(직무)

데이터 사이언티스트

Data Scientist
  • 빅데이터 전략에 맞는 DB구축
  • 대용량 데이터 처리 시스템 구축, 실험 및 평가
  • AI 분석모델을 활용하기 위한 웹 기반 프로토타인 설계 / 개발
  • 서버, 기기의 데이터 수집, 데이터 Govermance, 데이터 표준화 및 품질 관리





응용 SW 개발자

Application software developer
  • Frontend 개발 (차트, 맵 등 활용)
  • 프로그래밍 언어 활용 개발 (Java, Python, SQL)
  • Backend 개발, 분산처리, 실시간처리 및 클라우드 시스템 활용 개발 (Docker, NoSQL DBMS )
  • DB관리, DB아키텍처, SW개발, DB설계, SW 프로젝트관리 (SW설계/관리)
  •  
  •  

빅데이터 분석가

Big Data Analyst
  • 비즈니스 요구에 따른 비즈니스 모델링 지원
  • 빅데이터를 통한 데이터/리포트 자동화 및 성과분석, 데이터 시각화
  • 과거 프로세스 개선 및 신규지표 개발, 관리
  • 고객 관심사/성향분석, 유저 타겟팅, 빅데이터분석 모델링 개발
  •  
  •  

취업지원활동

취업박람회

2020 혁신성장청년인재 집중양성 인공지능분야

취업박람회

2020 혁신성장청년인재 집중양성 인공지능분야

기업설명회

(주)삼영기계, (주)유토비즈, (주)레드윗

취업특강

2022 고용노동부 빅데이터, 공공데이터 과정 취업특강

팀별 기업멘토링

인공지능, 블록체인 분야

팀별 기업멘토링

인공지능, 블록체인 분야

관련분야 취업률

인공지능 분야

수강후기

미래융합교육원에서 k-디지털트레이닝 교육과정 참여하기