전체 글

전체 글

    7월 회고

    [이 글은 기존 github 블로그에서 2022.07.31에 작성된 글입니다.] 구글 머신러닝 부트캠프 작년에 두번 지원했는데 떨어졌던 구글 머신러닝 부트캠프가 올해도 모집을 했다. 올해는 꼭 기회를 잡고 싶어서 공부한 내용을 어떻게 잘 정리하고 활용할지 중점으로 지원서에 썼다. 그전에 두번이나 떨어져서 이번에는 될까 싶었는데 부트캠프 3기에는 참여할 수 있게 되었다! 너무 신났고 아쉽지 않도록 잘 활용하자고 다짐하고 시작했다. (이 글을 쓰고 있는 현재...점점 어렵다...) 권순선 멘토님 커피챗 구글 머신러닝 부트캠프의 권순선 멘토님이 커피챗을 열어주셔서 바로 신청했다. 리눅스 블로그와 큰 행사에서 발표도 많이 하셔서 글쓰고 말하기를 잘하는 방법을 알아내고 싶었다... 하지만 비법은 없다는 것을 알려..

    "Hello World" in Kaggle: 캐글에서 Hello World 같은 데이터셋

    [이 글은 기존 github 블로그에서 작성해 티스토리로 옮긴 글입니다.] 프로그래밍을 공부하고 실습할 때 가장 먼저 해보는 print("Hello World") 데이터 사이언스를 공부할 때 Hello World 같은 데이터들은? Dataset MNIST Dataset Iris Project and Dataset Titanic Project and Dataset Housing Prices project and Dataset House Prices Credit Card Fraud Detection Project and Dataset Fake News Detection Project and Dataset COVID19 Tweets Project and Dataset Air Pollution in Seoul ..

    Cookie

    [이 글은 기존 github 블로그에서 2022.08.12에 작성된 글입니다.] 🍪 쿠키란? 사용자를 식별하고 세션을 유지하는 방식. 쿠키는 캐시와 충돌할 수 있기때문에 대부분 쿠키에 있는 내용을 캐싱하지 않는다. 쿠키 타입 세션 쿠키: 사용자가 사이트를 탐색할 때, 관련한 설정과 선호 사항들을 저장하는 임시 쿠키. 사용자가 브라우저를 닫으면 삭제된다. 지속 쿠키: 사용자가 주기적으로 방문하는 사이트에 대한 설정 정보나 로그인 이름을 유지하려고 사용. 디스크에 저장되어 브라우저를 닫거나 컴퓨터를 재시작하더라도 남아있다. 동작 방식 웹 서버는 처음 사용자에 대해서 아무것도 모르는 상태이지만 사용자가 다시 돌아왔을 때, 해당 사용자를 식별하기 위한 유일한 값을 쿠키에 할당한다. 쿠키는 어떤 정보든 포함할 수..

    정규화

    [이 글은 기존 github 블로그에서 작성해 티스토리로 옮긴 글입니다.] 정규화 normalization 이상현상이 발생하는 릴레이션을 분해하여 이를 없애는 과정. 이상현상을 일으키는 함수 종속성의 유형에 따라 등급을 구분할 수 있다. 제 1 정규형 A relation in which the intersection of each row and column contains one and only one value. 릴레이션의 모든 속성 값이 원자값을 가지면 제 1 정규형이라고 한다. 🛠 정규형 변환 제 2 정규형 A relation that is in first normal form and every non-primary key attribute is fully functionally dependent ..

    데이터베이스 이상현상

    [이 글은 기존 github 블로그에서 작성해 티스토리로 옮긴 글입니다.] 이상현상 Anomaly 💡 잘못 설계된 테이블로 데이터 조작(삽입, 삭제, 수정)을 하면 일어난다. 😈 삭제이상 튜플 삭제 시 같이 저장된 다른 정보까지 연쇄적으로 삭제되는 현상 😈 삽입이상 튜플 삽입 시 특정 속성에 해당하는 값이 없어 NULL값을 입력해야하는 현상 😈 수정이상 튜플 수정 시 조건을 잘못 주어서 중복된 데이터의 일부만 수정되어 데이터의 불일치 문제가 일어나는 현상 함수 종속성 어떤 속성A의 값을 알면 다른 속성 B의 값이 유일하게 정해지는 의존 관계 A→B: A는 B의 결정자. ⚠️ 결정자는 단일 속성일 수도, 복합 속성일 수도 있다! 표현) x → y : y는 x의 함수 = y는 x에 함수적으로 종속 = y는 ..

    데이터베이스 개념, 데이터 무결성

    데이터베이스 프로젝트에 필요한 정보를 얻기 위해 논리적으로 연관된 데이터를 모아 구조적으로 통합해 놓은 것 - 데이터베이스 개론 개념 integrated data: 중복을 최소화함으로써 데이터 불일치 현상을 없앤다 stored data: 컴퓨터 저장장치에 저장된 데이터 operationl data: 프로젝트의 목적을 위해 사용되는 데이터 shared data: 여러 사람이 동시에 사용할 수 있다 특징 real time accessibility: 사용자가 요청하는 순간에 실제 데이터를 서비스 continuous change: 삽입, 삭제, 수정등으로 바뀐 데이터값 저장 concurrent sharing: 동시에 여러 사용자가 데이터 요청가능 reference by content 데이터 구조 외부 단계- 외..

    2021년 회고

    [이 글은 기존 github 블로그에서 작성해 티스토리로 옮긴 글입니다.] 😷 올해도 코로나 올해도 코로나는 끝나지 않았다… 이제는 ‘곧 끝나겠지’라는 생각도 들지 않지만 ‘언젠간 끝나겠지’라는 마음이다. 언젠가 끝날 때까지 모두 건강하길! 🖥 Mac mini M1 사용기 10년 동안 쓴 데스크탑을 보내주고 MacOS를 체험해 보고 싶어서 Mac mini M1을 선택했다. 일단 맥북보다 가격이 낮았고(옵션을 추가했더니 원래 가격보다 더 올라갔지만) 발열, 소음이 거의 없었다. 1년 동안 사용하면서 성능도 만족한다. 다만 아직 개발 생태계에서 지원해 주지 않는 곳이 아직 있을 수 있다. 가끔 개발환경 세팅하거나 이전에 썼던 툴이 설치가 안 되거나 실행이 안 된다면 ‘이걸 M1이 또..?‘라고 생각된다. 하..

    Floyd Warshall Algorithm

    Floyd Warshall 그래프의 모든 노드 쌍에 대한 최단거리를 구하는 알고리즘 모든 지점끼리의 거리를 구한다. 다이니믹 프로그래밍 기반이다. A->B로 다이렉트로 가는 경로와 A->k->B 경유해서 가는 경로를 비교해서 더 비용이 작은 경로의 값으로 갱신한다. 시간복잡도: O(V^3) 구현 INF = int(1e9) def floyd(graph, n): for k in range(1, n+1): for i in range(1, n+1): for j in range(1, n+1): graph[i][j] = min(graph[i][j], graph[i][k] + graph[k][j]) n, m = map(int, input().split()) # 노드, 간선 개수 graph = [[INF] * (n+1..