본문 바로가기

728x90

IT

(221)
[프로그래머스] Lv.0 평행 [Python] 4개의 점 중에서 2개씩 이어서 평행이 되는지 확인하는 문제 더보기 문제 설명 점 네 개의 좌표를 담은 이차원 배열 dots가 다음과 같이 매개변수로 주어집니다. [[x1, y1], [x2, y2], [x3, y3], [x4, y4]] 주어진 네 개의 점을 두 개씩 이었을 때, 두 직선이 평행이 되는 경우가 있으면 1을 없으면 0을 return 하도록 solution 함수를 완성해보세요. 제한사항 dots의 길이 = 4 dots의 원소는 [x, y] 형태이며 x, y는 정수입니다. 0 ≤ x, y ≤ 100 서로 다른 두개 이상의 점이 겹치는 경우는 없습니다. 두 직선이 겹치는 경우$($일치하는 경우$)$에도 1을 return 해주세요. 임의의 두 점을 이은 직선이 x축 또는 y축과 평행한 경우는 주어지..
[NLP] Word Embedding 기법 [기초] Word Embedding 기법 소개 자연어 처리$($Natural Language Processing, NLP$)$ 분야에서 텍스트 데이터를 다루는 데 있어서 핵심적인 개념 중 하나가 Word Embedding입니다. Word Embedding은 단어를 벡터로 표현하는 기법으로, 컴퓨터가 텍스트 데이터를 더 효과적으로 이해하고 처리할 수 있게 해주는 중요한 도구입니다. Word Embedding이란? Word Embedding은 단어를 고차원의 실수 벡터로 매핑하는 것을 의미합니다. 이를 통해 단어 간의 의미적 유사성을 벡터 공간에서 측정할 수 있습니다. 예를 들어, "king"과 "queen"이라는 두 단어가 비슷한 벡터 공간 상에 가깝게 위치한다면, 이들은 의미적으로 유사한 관계를 갖고 있다고 볼 ..
[프로그래머스] Lv.0 정수를 나선형으로 배치하기 [Python] 시계방향, 바깥에서 안으로 들어가는 나선 방향을 따라 숫자를 배치하는 문제 더보기 문제 설명 양의 정수 n이 매개변수로 주어집니다. n × n 배열에 1부터 $n^2$ 까지 정수를 인덱스 [0][0]부터 시계방향 나선형으로 배치한 이차원 배열을 return 하는 solution 함수를 작성해 주세요. 제한사항 1 ≤ n ≤ 30 nxn 행렬 생성 $($0,0$)$ 부터 조건에 따라 숫자를 배치하기 위해 초기값 $($0,0$)$ 설정 dr = $($0,1,0,-1$)$ : 0, 하, 0, 상 dc = $($1,0,-1,0$)$: 우, 0, 좌, 0 >>> 시계방향$($우, 하, 좌, 상$)$으로 이동 첫 바퀴는 각 방향마다 n-1 번씩 이동하면 한 바퀴를 돌아서 원자리로 돌아옵니다. 그래서 좌,하 방향으로..
[프로그래머스] Lv.0 옹알이[1] [Python] 발음 가능한 문자열만 사용해서 가능한 옹알이의 개수를 구하는 문제 발음 가능한 문자열 배열: ["aya", "ye", "woo", "ma"] $($각 문자열은 최대 1번 사용$)$ https://school.programmers.co.kr/learn/courses/30/lessons/120956 더보기 문제 설명 머쓱이는 태어난 지 6개월 된 조카를 돌보고 있습니다. 조카는 아직 "aya", "ye", "woo", "ma" 네 가지 발음을 최대 한 번씩 사용해 조합한$($이어 붙인$)$ 발음밖에 하지 못합니다. 문자열 배열 babbling이 매개변수로 주어질 때, 머쓱이의 조카가 발음할 수 있는 단어의 개수를 return하도록 solution 함수를 완성해주세요. 제한사항 1 ≤ babbling의 길이 ..
[통계] Day 3-3 데이터 분포 가정과 가정 검토 데이터 분석을 위해 확률 분포 모형을 선택하고 분석하는 과정에서 데이터 분포의 가정을 세우고 검토하는 과정은 매우 중요합니다. 올바른 가정을 세우고 검토하지 않으면 잘못된 결과를 도출할 수 있습니다. 이를 위해 데이터 분포 가정과 가정 검토에 대해 알아보겠습니다. 1. 데이터 분포 가정 데이터 분석을 위해서는 데이터가 어떤 확률 분포를 따르는지를 가정하는 것이 필요합니다. 예를 들어, 데이터가 정규 분포, 이항 분포, 포아송 분포와 같은 특정한 확률 분포를 따른다고 가정합니다. 데이터 분포의 모양과 특징을 파악하여 적절한 확률 분포 모형을 선택합니다. 이 가정에 따라 모수 추정 및 통계적 검정을 수행하여 데이터를 분석합니다. 2. 가정 검토 데이터 분포 가정을 세우고 분석을 진행할 때, 이 가정이 실제 ..
[통계] Day 3-2 분포 모형에 대한 이해 분포 모형은 확률 변수가 가질 수 있는 값들의 빈도나 가능성을 나타내는 함수입니다. 이 함수를 통해 우리는 확률 변수가 특정 값일 확률을 예측하거나 분석할 수 있습니다. 확률 분포에는 확률밀도함수, 누적분포, 확률 질량함수와 같은 여러가지 개념이 포함되어 있습니다. 이를 통해 우리는 다양한 현상과 데이터의 분포를 설명하고 예측하는데 활용할 수 있습니다. 1. 확률 분포의 개념과 종류 확률 분포는 확률 변수의 가능한 값들과 그 값들이 나타날 확률을 나타내는 함수입니다. 데이터 분석에서 확률 분포는 중요한 개념으로, 데이터의 특성과 패턴을 파악하는 데 도움을 줍니다. 다양한 현상과 데이터를 설명하는 확률 분포의 종류가 있으며, 각각의 분포는 특정한 형태와 특징을 가지고 있습니다. 1-1. 일반적인 확률 분포..
[통계] Day 3-1 상관 분석 데이터 분석과 통계 분야에서 중요한 개념 1. 상관 분석 $($Correlation Analysis$)$: - 변수 간의 관련성을 측정하는 통계 기법. - 두 변수 사이의 선형 관계 정도를 파악하며, 두 변수 간의 상관계수로 표현됨. - 피어슨 상관계수, 스피어만 상관계수, 켄달의 타우 등이 있음. 2. 피어슨 계수 $($Pearson Correlation Coefficient$)$: - 두 연속형 변수 간의 선형 상관관계를 측정하는 방법. - -1과 1 사이의 값을 가지며, 0은 상관관계가 없음을 나타냄. - 피어슨 상관계수 공식: \[ r = \frac{\sum{(x_i - \bar{x})(y_i - \bar{y})}}{\sqrt{\sum{(x_i - \bar{x})^2} \cdot \sum{(y_i..
[프로그래머스] Lv.3 택시 요금 [Python] [문제] 지점의 개수 n, 출발지점을 나타내는 s, A의 도착지점을 나타내는 a, B의 도착지점을 나타내는 b, 지점 사이의 예상 택시요금을 나타내는 fares가 매개변수로 주어집니다. 이때, A, B 두 사람이 s에서 출발해서 각각의 도착 지점까지 택시를 타고 간다고 가정할 때, 최저 예상 택시요금을 계산해서 return 하도록 solution 함수를 완성해 주세요. 만약, 아예 합승을 하지 않고 각자 이동하는 경우의 예상 택시요금이 더 낮다면, 합승을 하지 않아도 됩니다. https://school.programmers.co.kr/learn/courses/30/lessons/72413 더보기 문제 설명 [본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.] 밤늦게 귀가할 때 안전을 위해 ..
[통계] Day 2-3 가설 검정과 분석 방법 가설검정은 통계학에서 중요한 개념으로, 데이터를 분석하여 특정 가설이 맞는지 여부를 결정하는 과정입니다. 가설검정은 아래와 같은 핵심 요소들로 구성됩니다. 귀무가설과 대립가설 - 귀무가설$($null hypothesis$)$: 연구자가 처음부터 기각하려는 가설로, 일반적으로 무의미한 차이나 효과가 없다는 가정입니다. 귀무가설은 유의수준$($alpha$)$과 함께 정의되며, 가설 검정 결과에 따라 기각 여부가 결정됩니다. - 대립가설$($alternative hypothesis$)$: 연구자가 입증하려는 가설로, 일반적으로 귀무가설과 반대되는 주장을 나타냅니다. 대립가설은 단측$($한 방향으로의 차이$)$ 또는 양측$($양방향으로의 차이$)$으로 설정됩니다. 유의수준과 p-값 - 유의수준$($alpha$)..
[통계] Day 2-2 데이터 분석 방법 데이터 분석의 다양한 방법과 도구 데이터 분석은 수많은 방법과 도구를 활용하여 다양한 유형의 데이터를 이해하고 해석하는 프로세스입니다. 다양한 데이터 유형에 대한 분석 기법을 알아보고, 그에 대한 간략한 설명을 제공하겠습니다. 수치형 데이터 분석 1. QQ-Plot: 정규 분포 가정을 확인하는 시각화 도구입니다. 분석 대상 데이터의 분포와 정규 분포의 이론적 분포를 비교하여 정규성을 판단합니다. 2. t-검정: 두 집단 간 평균 차이를 검정하는 통계적 방법입니다. 일반적으로 두 그룹의 평균이 유의미한 차이가 있는지 검증합니다. 예$)$ 두 가지 신약의 효과를 비교하고자 할 때 사용됩니다. 한 그룹에는 신약 A를, 다른 그룹에는 신약 B를 투여하고 각 그룹의 치료 효과를 비교하려고 합니다. t-검정을 통해..
[통계] Day 2-1 데이터 형태: 순서형, 이진, 시계열, 공간 다양한 유형의 데이터 분석과 시각화 방법 데이터 분석은 다양한 유형의 데이터를 이해하고 분석하는 과정을 포함합니다. 각 유형의 데이터는 그 특성에 따라 다른 분석 및 시각화 방법을 요구합니다. 이제 몇 가지 주요한 데이터 유형과 그에 따른 분석 방법을 살펴보겠습니다. 1. 순서형 데이터 $($Ordinal data$)$: 순서형 데이터는 서로 다른 카테고리에 속하면서도 일정한 순서나 계층 구조를 가지는 데이터입니다. 이러한 데이터를 분석할 때에는 중앙값, 사분위수, 백분위수 등의 대표값을 사용하여 데이터의 특성을 파악합니다. 시각화에는 막대 그래프나 도수분포표와 같은 방법을 활용합니다. 2. 이진 데이터 $($Binary data$)$: 이진 데이터는 두 가지 값 중 하나만 가지는 데이터로, 명목형 데이..
[프로그래머스] Lv.2 두 원 사이의 정수 쌍 [Python] 2차원 직교 좌표계에서 중심이 원점인 서로 다른 크기의 두 원의 사이$($경계 포함$)$ 점 중에서 좌표가 모두 정수인 점의 개수를 구하는 문제 더보기 문제 설명 x축과 y축으로 이루어진 2차원 직교 좌표계에 중심이 원점인 서로 다른 크기의 원이 두 개 주어집니다. 반지름을 나타내는 두 정수 r1, r2가 매개변수로 주어질 때, 두 원 사이의 공간에 x좌표와 y좌표가 모두 정수인 점의 개수를 return하도록 solution 함수를 완성해주세요. ※ 각 원 위의 점도 포함하여 셉니다. 제한 사항 1 ≤ r1 < r2 ≤ 1,000,000 접근 방법: x축의 양의 부분을 포함하여 1사분면 위의 점의 개수를 구한 후, 그 값의 4배를 출력 다음 두 구간 0 ≤ y < r1 과 r1 ≤ y < r2 으로 구분..