분류 전체보기 38

[AI School/TIL] Python 3일차_23.01.04

2023.01.04 (수) 파이썬 3번째 강의를 들었습니다. [Python 문법 3] 오늘은 오늘은 함수에 대해서 배웠습니다. 언제 어떻게 사용하고, 어떤 장점이 있는지를 중점적으로 알 수 있었습니다. 1. 함수 : 반복적으로 사용되는 코드를 묶어서 사용하는 방법 (코드의 유지보수가 쉬워짐) def, return, argument, parameter, docstring, scope, lamda 사용방법 : 함수 선언 (코드 작성) -> 함수 호출 (코드 실행) def import random # 1. 로또번호 저장 변수 생성 lotto = [] # 2. 아래의 코드 반복 : while while True: # 2-1. 1 ~ 45 랜덤한 숫자 출력 후 저장 : random_number : random.r..

[AI School/TIL] Python 2일차_23.01.03

2023.01.03 (화) 파이썬 2일차 강의를 들었습니다. 연산자에 대한 수업을 진행하기 전에 데이터 규모에 따른 스킬에 대한 배경설명이 진행되었습니다. [데이터 규모에 따른 스킬들] 데이터베이스 SQL / Python / Excel로 데이터를 다루는 것이 각각 어떤 차이점이 있는지 ? 1. 엑셀 : 데이터 100만개, 만들어진 기능만 사용 가능하다, 속도가 느리다, 사용이 간편함 2. 파이썬 : 데이터 RAM 용량만큼, 기능을 만들어서 사용 가능하다, 속도가 빠름 (넘파이 패키지), 파이썬 문법 2-1. DASK : 파이썬 가상메모리 사용 (데이터베이스 구축하지 않아도 되는 장점이 있음) ex) H기업에서 사용하는 사례가 있었음. 3. 데이터베이스 : 데이터 SSD(HDD) 용량만큼, 속도가 빠름(파..

[AI School/TIL] Python 1일차_23.01.02

2023년 1월 2일 (월) 박두진 강사님의 수업으로 본격적인 파이썬에 대한 강의가 시작되었습니다. [Intro_Python] 파이썬 언어에 대한 이해를 돕기 위해서, 프로그래밍이 무엇인지에 대한 전반적인 흐름을 익혔습니다. What is Programing? : OS(Operating System)에서 CPU, RAM, SSD를 사용하여 컴퓨터에게 연산 과제를 수행하게 하는 절차 및 방법 1. Computer Structure CPU - 중앙처리장치 RAM - 메모리 SSD (HDD) - 하드디스크 EX) 엑셀파일을 실행해서 연산 수행 후, 파일 저장하는 과정 Step 1. 엑셀 실행 -SSD에 있는 Excel Code를 RAM으로 이동 (loading) Step 2. 엑셀 화면 출력 -RAM에 있는 ..

[AI School/WIL] 1주차 자기주도 학습_22.12.23

[2022.12.20] 파이썬에서 자주 사용하는 문법에 대한 압축 강의를 들었습니다. 기초 강의를 들으면, 보통 print("Hello World") 부터 시작할 것이라는 예상을 깨고, 바로 코드를 작성하는 단계로 시작을 해서, 좀 더 재밌게 수업 내용이 이해가 되었습니다. 무작위로 데이터를 뽑고 싶을 때, 어떻게 해야하지? 라는 생각이 들 때, 바로 아래와 같은 소스코드가 생각이 날 것 같아요. 다 짜여진 코드부터 보자면, [오늘 뭐 드실?] import random import time lunch = ["된장찌개", "피자", "제육볶음", "짜장면"] while True: print(lunch) item = input("음식을 추가 해주세요 : ") if(item == "q"): break else..

decision tree의 원리, Gini index, Entropy, 예제

의사결정나무 (decision tree)의 원리에 대해서 간략하게 알아보기. 머신러닝, 딥러닝은 통계학과 선형대수학(행렬, 벡터 등)을 기반으로 계산하는 기법들이 대다수임. * 머신러닝은 주로 정형화된 데이터를 활용하고, 딥러닝은 비정형화된 데이터 (이미지, 음성, 비디오 등)를 활용 1. 기계학습(machine learning) 중에서 지도학습 (supervised) 중에서 분류 (classifier) 기법에 해당 2. 개요 뿌리(Root) : 최상위에 있는 노드 (node)의 분류가 시작되는 곳 부모(Parent) 노드 : 상위 노드 자식(Children) 노드 : 하위 노드 말단(Leaf) 노드 : 최하위에 있으며, 더 이상 분류되지 않는 노드 3. 원리 뿌리 노드에 전체 데이터가 속해 있으며, 상..

[24년 2월 1째주 회고] 기준일이 다른 데이터들의 datediff 구할 때 유의할 점

주니어 데이터 분석가로서 시행착오를 겪고, 보완해나가는 과정을 기록하는 중입니다등록일이 모두 다른 콘텐츠의 D+0부터 D+6까지 각 날짜별 매출액을 구해달라는 요청을 받았다.콘텐츠의 등록일을 쭉 살펴보니 모두 2023년도에 등록되었다. 예시) (제가 어렸을 때 좋아하던 애니메이션들로 가상의 데이터를 만들어봤습니다 :) )noproduct_idproduct_nameregistration date1ABC1001핑구2023-01-152ABC1002페트와 매트2023-05-053ABC1003월레스와 그로밋2023-07-014ABC1004둘리2023-12-015ABC1005두치와 뿌꾸2023-12-29 우선 요청받은 리스트를 각 필드마다 구분자를 "|"로 설정해서 .txt 파일로 저장 후, create table..

Velog, Naver Blog에서 Tistory로 통합 포스팅합니다.

#1 Velog https://velog.io/@milkim0818/ milkim0818 (Miri Kim) / 작성글 - velog Data Scientist로 나아가는 기록들 velog.io #2 Naver Blog https://blog.naver.com/meggy0818 직업인이 되어가는 여정 : 네이버 블로그 호기심이 많은 INTP의 하고싶은 일을 찾고, 그 일을 잘 하기 위해 공부해나가는 블로그입니다 :) blog.naver.com #3 티스토리로 이전하게 된 배경 Velog와 네이버 블로그의 포스팅을 모두 Tistory에 통합해서 관리하려고 합니다. 네이버 블로그는 부트캠프에서 강의들은 내용을 매일 기록하는 형식으로 작성했고, Velog는 마크다운으로 오픈소소들을 실습한 과정을 정리했었습니다..

카테고리 없음 2023.02.11