본문 바로가기

분류 전체보기

(173)
[자연어 처리] 딥러닝을 이용한 자연어 처리를 위한 패키지 설치 #버전과 환경에 따라 오류가 발생할 수 있음# Anaconda 에서 자연어 처리를 하기 위해 필요한 패키지를 설치! 1. Anaconda 설치하기. - 현재 가장 최신 버전으로 설치.(2021.05.15 기준 파이썬 3.8 버전) 2. 가상환경 생성 - 모든 환경을 최신 버전으로 맞추면 서로 호환이 되지않아 오류가 계속 발생하는 것 같아서 최신 버전이 아닌 서로 호환가능한 버전으로 설치하기 위해 파이썬 3.7버전의 가상 환경을 생성하였다 3. 필요 패키지 설치 - conda install 을 이용하여 설치를 해보기도 했지만 무슨 이유인지 계속 오류가 나서 pip로 설치 - pip install tensorflow==2.2 -user "가상환경이름" - pip install keras - pip insta..
[4주차 - 과제] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시 보드 개발 주제 : 인사이트가 한 눈에 들어오는 대시보드 만들기 전 직원이 보면서 확인하는 대시보드가 필요하기도 하고 팀별로 확인하는 대시보드가 필요하기도 하다. 좋은 대시보드를 만들기 위해서는 각 지표들을 다양한 각도에서 볼 수 있어야 한다. 또한, 지표만을 보여주는 것이 아니라 데이터 분석가가 유의미한 기준을 제시해주는 것도 좋은 방법이다. >> Redash 대시보드를 이용하여 Northwind 데이터 분석 대시보드 개발 #3개월 총 매출(분기 기준) select concat(round(sum(od.quantity*od.unit_price),1),' $') as '매출액' from orders o left join order_details od on o.id=od.order_id where order_date ..
[3주차 - 과제] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시 보드 개발 주제 : 데이터 분석 보고서 작성하기 내용 : 단순히 개별 지표를 추출하는 것을 넘어 이를 시각화하여 보고서 형태로 만들어 봅니다. 이를 위해 먼저 지표라는 것이 무엇인지, 어떻게 정의하고 측정할 것인지 알아봅니다. 그리고 다양한 표와 그래프를 활용한 시각화 방법과 데이터 분석 보고서 작성 방법에 대해 알아보고 직접 보고서를 작성합니다. 진행순서 : 지표에 대한 이해 > 다양한 시각화 방법 > 분석 보고서 작성 방법 > 실전 분석 보고서 작성 업무를 수행 # 지표에 대한 이해 지표란 기업에서 어떤 대상의 성과 평가를 하기 위해 사용되는 기준을 말한다. CTR(노출수), CVR(전환율) 등이 있다. 팀에서 관리하는 지표를 추출하거나 추이를 모니터링 하면서 현황을 분석하는 일을 한다. 이를 위해 서비스 프로..
[2주차 - 과제] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시 보드 개발 1. 상품(product)의 카테고리(category)별로, 상품 수와 평균 가격대(list_price)를 찾는 쿼리를 작성하세요. select category ,count(product_code) ‘상품’, avg(list_price) ‘평균가격’ from products group by category ; /* 멘토 피드백 COUNT (1) 은 널값을 포함한 개수 COUNT(컬럼명) 은 널값을 포함하지 않은 개수 */ /* 멘토 예시 답안*/ select category, count(1) cnt, avg(list_price) avg_price from products group by category; 2. 2006년 1분기에 고객(customer)별 주문(order)횟수, 주문한 상품(product)..
[1주차 - 과제] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시 보드 개발 1. Country 별로 ContactName이 ‘A’로 시작하는 Customer의 숫자를 세는 쿼리 SELECT Country, COUNT(*) FROM Customers WHERE ContactName LIKE 'A%' GROUP BY Country ; 2. Customer 별로 Order한 Product의 총 Quantity를 세는 쿼리 SELECT C.CustomerID, SUM(OD.Quantity) FROM OrderDetails AS OD JOIN Orders AS O ON O.OrderID = OD.OrderID JOIN Customers AS C ON C.CustomerID = O.CustomerID GROUP BY C.CustomerID ; 3. 년월별, Employee 별로 Produ..
[1주차]SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시 보드 개발 SQL is a programming language designed to manipulate and manage data stored in relational databases. A relational database is a database that organizes information into one or more tables. A table is a collection of data organized into rows and columns. A statement is a string of characters that the database recognizes as a valid command. CREATE TABLE creates a new table. INSERT INTO adds a new ..
[코드잇] 분할 정복 분할정복은 어떤 문제를 나눌 수 없을 때까지 나누어서 각각을 풀어서 다시 합병하여 문제의 답을 얻는 알고리즘 재귀는 단순히 함수가 자신을 참조하는 것 합병 정렬 : 하나의 리스트를 두 개의 균등한 크기로 분할하고 분할된 부분 리스트를 정렬한 다음, 두 개의 정렬된 부분 리스트를 합하여 전체가 정렬된 리스트가 되게 하는 방법 > 분할, 정복, 결합 의 반복 다시 합병하여 문제의 답을 얻는 알고리즘 def merge(list1, list2): i = 0 j = 0 # 정렬된 항목들을 담을 리스트 merged_list = [] # list1과 list2를 돌면서 merged_list에 항목 정렬 while i list2[j]:..
[코드잇] 알고리즘 연습2 Brute Force 강남역에 엄청난 폭우가 쏟아진다고 가정합시다. 정말 재난 영화에서나 나올 법한 양의 비가 내려서, 고층 건물이 비에 잠길 정도입니다. 그렇게 되었을 때, 건물과 건물 사이에 얼마큼의 빗물이 담길 수 있는지 알고 싶은데요. 그것을 계산해 주는 함수 trapping_rain을 작성해 보려고 합니다. 함수 trapping_rain은 건물 높이 정보를 보관하는 리스트 buildings를 파라미터로 받고, 담기는 빗물의 총량을 리턴해 줍니다. 예를 들어서 파라미터 buildings로 [3, 0, 0, 2, 0, 4]가 들어왔다고 합시다. 그러면 0번 인덱스에 높이 33의 건물이, 3번 인덱스에 높이 22의 건물이, 5번 인덱스에 높이 44의 건물이 있다는 뜻입니다. 1번, 2번, 4번 인덱스..