Want to Become a Sponsor? Contact Us Now!🎉

인기 있는 AI 도구
Mitosheet | Excel에서 Python 코드 자동 생성 | Jupyter Notebook에서 Excel 스프레드시트 사용하기

Mitosheet: Excel for Python? Jupyter Notebook에서 스프레드시트 작업하기

Published on

JupyterLab 및 Streamlit과 완벽하게 통합되는 혁신적인 도구인 Mitosheet의 세계로 빠져들어 보세요. 이 가이드에서는 설치부터 고급 기능까지 모두 다루고 있습니다. 데이터 과학 게임을 업그레이드할 준비가 되었나요!

데이터 과학은 데이터 조작, 분석 및 시각화를 위해 다재다능한 도구를 요구하는 계속 발전하는 분야입니다. Jupyter 노트북은 많은 사람들이 사용하는 플랫폼이지만, 데이터 과학가들을 위해 일반화된 도구보다 특화된 도구를 사용할 수 있는 여지가 항상 있습니다. 이를 위해 Mitosheet이 등장했습니다. 이 도구는 JupyterLab과 Streamlit 환경과 완벽하게 통합되어 스프레드시트의 강력함을 제공합니다. 이 문서는 Mitosheet을 이해하고 사용 방법을 익히기 위한 포괄적인 안내서를 제공합니다.

경험이 많은 데이터 과학자든 실전 데이터로 경험을 쌓으려는 초보자든, Mitosheet을 사용하면 작업을 단순화할 수 있는 다양한 기능을 제공합니다. 이 도구를 설치하고 고급 기능을 사용하는 방법에 대해 자세히 알아봅시다. 그러면 시작해봅시다!

Mitosheet이란 무엇인가요?

Mitosheet은 JupyterLab 및 Streamlit 앱에서 작동하는 동적인 도구입니다. 이 도구는 스프레드시트와 Python 기반 데이터 분석 사이의 간극을 줄이는 방식으로 Pandas 데이터프레임을 조작할 수 있는 기능을 제공합니다. 하지만 Mitosheet이 뛰어난 점은 스프레드시트에서 수행한 각 수정에 해당하는 Python 코드를 생성할 수 있는 능력입니다. 즉, 여러분은 고립된 환경에서 작업하는 것이 아니라, 큰 규모의 Python 프로젝트에 통합될 수 있는 재사용 가능한 코드를 생성하게 됩니다.

Mitosheet이 게임 체인저인 이유

  • 사용 편의성: Mitosheet의 직관적인 인터페이스는 Python이나 데이터 과학에 처음 접하는 사람에게도 접근성을 제공합니다.
  • 코드 생성: Mitosheet에서 수행한 모든 작업은 일반적으로 Pandas 라이브러리를 활용한 Python 코드를 생성합니다. 이 코드는 제품 수준의 코드이며 프로젝트의 다른 부분에서 사용할 수 있습니다.
  • 호환성: Mitosheet은 Python과 매우 호환성이 높아 기존의 Jupyter 노트북이나 Streamlit 앱에 원활하게 통합될 수 있습니다.

Mitosheet은 어떻게 작동하나요?

Mitosheet에서 작업을 수행할 때마다 해당 작업에 해당하는 Python 코드가 자동으로 생성됩니다. 예를 들어, 특정한 값을 보여주기 위해 열을 필터링한다면, Mitosheet은 동일한 작업을 수행하는 Pandas 코드 스니펫을 생성합니다. 이 코드는 Mitosheet 아래의 Jupyter 셀에 나타나며 실행하거나 프로젝트에 통합할 준비가 됩니다.

간단한 예제를 살펴보겠습니다. 'df'라는 데이터프레임이 있고 'Age' 열이 25보다 작은 행을 필터링하려고 한다고 가정해봅시다. Mitosheet에서 인터페이스를 사용하여 필터를 적용하면 생성되는 Python 코드는 다음과 같습니다:

df_filtered = df[df['Age'] >= 25]

이 기능은 데이터 분석에 능통하지만 코딩에는 편안하지 않은 사람들에게 특히 유용합니다. 이를 통해 사용자가 작업이 어떻게 Python 코드로 변환되는지 이해하는 데 도움이 되는 학습 곡선을 제공합니다.

스프레드시트의 간편함과 파이썬의 기능을 결합한 Mitosheet은 데이터 과학 도구 세트에서 독자적인 위치를 두고 있습니다. 탐색적 데이터 분석, 데이터 정리, 시각화 등을 수행할 때 Mitosheet을 사용하면 작업을 원활하고 효율적으로 수행할 수 있습니다.

Mitosheet 설치 방법

Mitosheet을 설치하는 방법은 기본적으로 여러 가지 방법이 있으며, 선호하는 환경에 따라 선택할 수 있습니다. 가장 일반적인 방법은 Python의 패키지 관리자인 pip를 사용하는 것입니다. 그러나 Mitosheet은 Docker 컨테이너를 사용하는 설치와 Streamlit 앱에 직접 설치하는 유연성을 제공합니다.

pip를 사용하여 Mitosheet 설치하기

Mitosheet을 쉽게 설치하려면 Python의 패키지 관리자인 pip를 사용하는 것이 가장 간단합니다. 터미널을 열고 다음 명령어를 실행하세요:

pip install mitoinstaller

설치가 완료되면 설치 프로그램을 실행해야 합니다:

python -m mitoinstaller install

이 명령어는 Mitosheet을 클래식 Jupyter 노트북과 JupyterLab 3.0에 모두 설치합니다. 이 과정은 일반적으로 빠르지만 시스템에 따라 시간이 다소 달라질 수 있습니다.

Docker 컨테이너에 Mitosheet 설치하기

Docker를 사용하면 모든 애플리케이션의 종속성을 하나의 컨테이너에 패키징하여 배포하고 실행할 수 있습니다. Docker 컨테이너에 Mitosheet을 설치하면 모든 종속성을 깔끔하게 캡슐화하여 일관된 환경을 제공합니다. 설치 방법은 다음과 같습니다:

  1. Dockerfile 생성하기: 먼저 프로젝트 디렉터리에 Dockerfile을 생성하세요.

  2. 기본 이미지 지정하기: 베이스 이미지로 Python 이미지를 사용하세요. Dockerfile에 다음 줄을 추가하세요:

    FROM python:3.8
  3. Jupyter Notebook 설치하기: Mitosheet은 Jupyter의 확장 기능이므로 Jupyter Notebook 또는 JupyterLab을 설치해야 합니다. Dockerfile에 다음 줄을 추가하세요: 범인 번역 markdown 파일 제공. 앞에 있으면 language 매개 변수도 카타리아니까 스펠링도 도와주세요. 코드는 번역하지 않고 주석만 번역하십시오. 파일은 다음과 같습니다:

    RUN pip install notebook
  1. Mitotesheet 설치: 다음 명령을 추가하여 Mitosheet를 설치합니다:

    RUN pip install mitosheet
  2. Mitosheet 확장기능 활성화: 마지막으로, Jupyter Notebook에서 Mitosheet 확장기능을 활성화하세요.

    RUN jupyter nbextension enable mitosheet --py --sys-prefix
  3. Docker 이미지 빌드: Dockerfile을 저장하고 다음 명령을 사용하여 이미지를 빌드하세요:

    docker build -t my-mitosheet-container .
  4. 컨테이너 실행: 이미지를 빌드한 후 다음을 사용하여 실행하세요:

    docker run -p 8888:8888 my-mitosheet-container

Streamlit 앱에 Mitosheet 설치

Streamlit은 Python으로 웹 앱을 생성하기 위한 인기있는 프레임워크입니다. Mitosheet을 Streamlit 앱에 직접 통합하여 데이터 조작 기능을 활용할 수 있습니다. 다음은 그 방법입니다:

  1. Streamlit 설치: 아직 설치하지 않았다면 pip를 사용하여 Streamlit을 설치하세요:

    pip install streamlit
  2. Mitosheet 설치: 다음 명령을 사용하여 Mitosheet을 설치하세요:

    pip install mitosheet
  3. 앱에서 가져오기: Streamlit 앱에서 다음과 같이 Mitosheet을 가져오세요:

    import mitosheet
  4. Mitosheet 초기화: Streamlit 앱 내에서 Mitosheet을 초기화하려면 다음 코드를 사용하세요:

    mitosheet.sheet()

Jupyter Notebook에 Mitosheet 확장기능 설치

데이터 과학자나 연구자로서 주로 Jupyter 노트북에서 작업하는 경우, Mitosheet 확장기능 설치는 간단합니다.

  1. Mitosheet 설치: 터미널을 열고 다음 명령을 실행하여 Mitosheet을 설치하세요:

    pip install mitosheet
  2. 확장기능 활성화: 다음 명령을 사용하여 Jupyter Notebook에서 Mitosheet 확장기능을 활성화하세요:

    jupyter nbextension enable mitosheet --py --sys-prefix
  3. 설치 확인: 새 Jupyter 노트북을 열고 다음 Python 코드를 실행하여 Mitosheet을 초기화하세요:

    import mitosheet
    mitosheet.sheet()

첫 번째 Mitosheet 생성하기

Mitosheet을 성공적으로 설치한 후 다음 단계는 첫 번째 Mitosheet을 생성하고 기능을 익히는 것입니다. 새 Mitosheet을 만드는 것은 JupyterLab이나 Streamlit 인터페이스에서 버튼을 클릭하는 것만으로 간단합니다.

Mitosheet으로 데이터 가져오기

Mitosheet은 클릭 한 번으로 CSV 및 XLSX 가져오기를 지원하여 데이터를 도구로 가져오기가 매우 쉽습니다. 다음과 같이 수행할 수 있습니다:

  1. Mitosheet 아이콘을 클릭하여 새 Mitosheet을 엽니다.
  2. '가져오기' 탭으로 이동합니다.
  3. 가져올 파일을 선택하고 '열기'를 클릭합니다.

이제 데이터가 스프레드시트와 유사한 인터페이스에 표시되어 조작할 준비가 되었습니다.

Mitosheet에서 기본 작업

데이터를 가져온 후 다양한 작업을 수행할 수 있습니다:

  • 필터링 및 정렬: 각 열 상단에있는 툴바를 사용하여 열을 쉽게 필터링 및 정렬할 수 있습니다.
  • 피벗 테이블: 데이터를 요약하기 위해 엑셀 스타일의 피벗 테이블을 만들 수 있습니다.
  • 열 연산: 열에서 기본적인 계산 및 변환을 수행할 수 있습니다.

예를 들어, 'Age'라는 열의 평균 연령을 계산하려는 경우, 해당 열을 선택하고 'Operations' 탭으로 이동하여 'Average'를 선택하면 됩니다. Mitosheet은 계산을 수행하는 뿐만 아니라 해당하는 Python 코드를 생성합니다:

average_age = df['Age'].mean()

첫 번째 Mitosheet을 만드는 것은 아주 쉽고 직관적인 인터페이스로 인해 사용자의 숙련도에 관계없이 즉시 시작할 수 있습니다. Mitosheet은 클릭 한 번으로 데이터 가져오기와 다양한 데이터 조작 옵션을 포함하여 데이터 분석 작업을 가능한 한 원활하게 만들기 위해 설계되었습니다.

기존 Mitosheet 가상 환경을 열려면 다음 단계를 따르세요:

# 환경 활성화
conda activate mitoenv
 
# Jupyter Lab 실행
jupyter lab

Mitosheet에서 함수 사용하는 방법

Mitosheet은 단순한 스프레드시트 도구가 아니라 데이터 분석 및 조작에 특화된 다양한 기능을 제공하는 포괄적인 플랫폼입니다. 필터링 및 정렬과 같은 기본 작업부터 데이터 시각화와 같은 고급 기능까지 다양한 함수를 제공합니다.

데이터 조작 함수

Mitosheet은 다양한 데이터 조작 함수를 제공합니다. 다음은 주요 기능입니다:

  • 열 변환: 전체 열에 대해 로그, 제곱근 및 삼각 함수와 같은 변환을 쉽게 적용할 수 있습니다.
  • 텍스트 작업: Mitosheet 내에서 부분 문자열 추출, 대소문자 변환 및 패턴 일치와 같은 텍스트 조작을 수행할 수 있습니다.
  • 날짜 및 시간 함수: Mitosheet에는 날짜 구문 분석, 형식 지정 및 산술 연산에 대한 내장 함수가 있어 날짜 및 시간 데이터를 손쉽게 처리할 수 있습니다.

예를 들어, 'Purchase_Date'라는 날짜 열에서 연도를 추출하려는 경우, Mitosheet은 다음과 같은 Python 코드를 생성할 것입니다:

df['Year'] = df['Purchase_Date'].dt.year

Mitosheet에서 데이터 시각화

Mitosheet의 뛰어난 기능 중 하나는 데이터 시각화 기능입니다. 도구 내에서 다음을 포함한 다양한 차트와 그래프를 생성할 수 있습니다:

  • 막대 차트
  • 선 그래프
  • 파이 차트
  • 산점도

차트를 생성하는 것은 데이터를 선택하고 차트 유형을 선택하는 것만큼 간단합니다. Mitosheet이 나머지를 처리해주며 Matplotlib 또는 Seaborn과 같은 라이브러리를 사용하여 Python 코드를 생성합니다.

MitoSheet 그래프 생성

고급 기능

Mitosheet은 더 복잡한 데이터 분석 작업에 매우 유용한 고급 기능도 제공합니다:

  • 결합 작업: 서로 다른 데이터프레임 간의 SQL과 유사한 조인 수행.
  • 그룹화 및 집계: 특정 열을 기준으로 데이터 집계를 수행하기 위해 'Group By' 기능을 사용. 예를 들어, 각 제품 카테고리의 총 매출을 찾고 싶다면, 'Category' 열을 기준으로 'Group By' 작업을 수행한 후 'Sales' 열을 합산하면 됩니다. 생성된 Python 코드는 다음과 같을 것입니다:
df_grouped = df.groupby('Category')['Sales'].sum().reset_index()

Mitosheet은 기본적인 데이터 조작부터 고급 데이터 조작까지 다양한 기능을 제공하여 데이터 과학 도구 상에서 다재다능한 툴로서의 역할을 합니다. 각 작업에 대한 Python 코드를 생성할 수 있는 능력은 작업을 큰 프로젝트에 통합하는 데 용이하게하고, 이러한 작업이 어떻게 프로그래밍적으로 수행되는지 이해하는 학습 도구로서도 역할합니다.

Mitosheet AI를 사용한 스프레드시트의 자동 생성된 Python 코드

Mitosheet은 데이터 조작을 위한 정적인 도구뿐만 아니라, 데이터 분석 프로세스를 크게 가속화 할 수있는 AI 기능도 통합하고 있습니다. 이러한 AI 기능은 반복적인 작업을 자동화하여 작업 흐름을 더욱 효율적으로 만드는데 사용됩니다.

자동 제안 및 예측 분석

Mitosheet의 가장 흥미로운 AI 기능 중 하나는 데이터에 기반한 자동 제안 기능입니다. 예를 들어, 매출, 수익 및 고객 평가와 같은 다양한 지표가 포함 된 데이터 세트를 작업하는 경우, Mitosheet은 자동으로 관련된 시각화 또는 통계 테스트를 제안할 수 있습니다.

이상 감지

다른 강력한 AI 기능 중 하나는 이상 감지입니다. 데이터 세트에 이상치나 이상 점이 포함 된 경우, Mitosheet은 자동으로 이를 표시할 수 있습니다. 이것은 사기 감지 또는 품질 관리와 같은 시나리오에서 이상 점을 빠르게 식별하는 데 매우 유용합니다.

데이터 정리 자동화

데이터 정리는 어떤 데이터 분석 프로세스의 가장 시간이 많이 소요되는 부분입니다. Mitosheet의 AI 기능을 통해 데이터 정리의 여러 측면을 자동화 할 수 있습니다. 누락 된 값 처리부터 데이터 유형 수정까지, Mitosheet은 모두 처리하여 소중한 시간을 절약 할 수 있습니다.

예를 들어, 누락 된 값을 가진 열이있는 경우, Mitosheet은 자동으로 이를 열의 평균, 중앙 값 또는 모드를 기반으로 채울 수 있습니다. 생성 된 Python 코드는 다음과 같을 수 있습니다:

df['Column_Name'].fillna(df['Column_Name'].mean(), inplace=True)

AI를 핵심 기능에 통합함으로써, Mitosheet은 단순한 스프레드시트 도구 이상으로 발전합니다. 데이터 분석 여정을 안내하고 추천을 제공하며, 하면서 작업을 자동화하는 스마트 어시스턴트가 됩니다.

Mitosheet에서 생성된 코드 사용 방법

Mitosheet의 가장 매력적인 기능 중 하나는 도구 내에서 취하는 각 작업에 대해 Python 코드를 생성 할 수있는 능력입니다. 이 코드는 부산물뿐만 아니라 다양한 방법으로 사용할 수 있는 가치있는 자산입니다.

Jupyter Notebook에 코드 통합

Mitosheet에서 수행하는 각 작업은 Mitosheet 아래의 Jupyter 셀에 자동으로 Python 코드로 변환됩니다. 이 코드는 노트북 내에서 직접 실행되어 결과를 즉시 확인할 수 있도록 해줍니다.

재사용성과 협업

생성된 코드는 매우 재사용 가능합니다. 다른 Python 스크립트 또는 Jupyter Notebook으로 쉽게 복사 할 수 있습니다. 이는 데이터 조작 단계를 팀원들과 공유해야하는 협업 프로젝트에서 특히 유용합니다.

예를 들어, Mitosheet에서 데이터 프레임을 필터링하고 정렬한 경우 생성된 코드를 동료와 공유 할 수 있습니다. 그러면 동료는 비슷한 데이터 세트에 동일한 변환을 적용 할 수 있습니다. 코드는 다음과 같을 수 있습니다:

df_filtered_sorted = df[df['Age'] > 25].sort_values(by='Salary', ascending=False)

Mitosheet 대안

Mitosheet은 데이터 분석을 위한 스프레드시트와 Python 코드 생성을 유일한 혼합물로 제공하지만, 고려할만한 다른 도구와 라이브러리도 있습니다:

  1. PandasGUI: Pandas DataFrames용 GUI를 제공하는 Python 라이브러리입니다. 쉬운 데이터 조작이 가능하지만, 활동에 기반한 Python 코드를 생성하지는 않습니다.

  2. DataPrep: 데이터 준비 프로세스를 간소화하기 위한 이 Python 라이브러리는 데이터를 정리, 시각화 및 이해하는 데 다양한 기능을 제공합니다.

  3. Jupyter Widgets: 이것은 Jupyter 노트북용 대화 형 위젯입니다. 직접적인 대체품은 아니지만, Jupyter Notebook에서 데이터 분석을위한 대화 형 대시 보드를 만드는 데 사용할 수 있습니다.

  4. Tableau: 강력한 데이터 시각화 도구로, 일부 데이터 조작 기능을 사용할 수 있습니다. Python 기반은 아니지만 강력한 기능을 제공합니다.

  5. Excel Power Query: Excel에 익숙한 사용자를 위해 Power Query는 데이터 변환을위한 GUI를 포함하여 다양한 데이터 조작 기능을 제공합니다.