NumPy是一款數字Python開發工具,包含強大的N維數組對象、復雜的(廣播)功能,集成C/C++和Fortran代碼的工具,有用的線性代數,傅立葉變換和隨機數功能。
強大的N維數組
NumPy矢量化,索引和廣播概念快速且通用,是當今陣列計算的實際標準。數值計算工具
NumPy提供了全面的數學功能,隨機數生成器,線性代數例程,傅立葉變換等。可互操作的
NumPy支持廣泛的硬件和計算平臺,并且可以與分布式,GPU和稀疏陣列庫一起很好地使用。表演者
NumPy的核心是經過優化的C代碼。借助編譯后的代碼,享受Python的靈活性。使用方便
NumPy的高級語法使其可以為來自任何背景或經驗水平的程序員訪問并提高生產力。開源的
NumPy是在開放的BSD許可下發行的,由一個活躍,響應迅速且多樣化的社區在GitHub上公開開發和維護。
NumPy位于豐富的數據科學圖書館生態系統的核心。
典型的探索性數據科學工作流程可能如下所示:
提取,轉換,加載: Pandas, Intake, PyJanitor
探索性分析: Jupyter, Seaborn, Matplotlib, Altair
建模和評估: scikit-learn, statsmodels, PyMC3, spaCy
儀表板中的報告: Dash, Panel, Voila
對于高數據量,Dask和 Ray是按比例縮放的。
穩定的部署依賴于數據版本控制(DVC),實驗跟 蹤(MLFlow)和工作流自動化(Airflow和 Prefect)。
分布式陣列和高級并行分析功能,可實現大規模性能。
兼容NumPy的數組庫,用于使用Python進行GPU加速計算。
NumPy程序的可組合轉換:區分,矢量化,即時編譯到GPU / TPU。
帶標簽的索引多維數組,用于高級分析和可視化
兼容NumPy的稀疏數組庫,該庫與Dask和SciPy的稀疏線性代數集成。
深度學習框架可加快從研究原型到生產部署的過程。
機器學習的端到端平臺,可輕松構建和部署基于ML的應用程序。
深度學習框架適用于靈活的研究原型和生產。
用于列式內存數據和分析的跨語言開發平臺。
具有廣播和惰性計算的多維數組,用于數值分析。
開發用于數組計算的庫,重新創建NumPy的基本概念。
使API與實現脫鉤的Python后端系統;unumpy提供了一個NumPy API。
Tensor學習,代數和后端可無縫使用NumPy,MXNet,PyTorch,TensorFlow或CuPy
由諸如XGBoost, LightGBM和 CatBoost之類的工具實現的ML算法包括稱為集成方法的統計技術
Yellowbrick和 Eli5 提供機器學習可視化。
NumPy是迅速發展的Python可視化領域的重要組成部分
其中包括 Matplotlib, Seaborn, Plotly, Altair, Bokeh, Holoviz,Vispy和 Napari等。
NumPy對大型數組的加速處理使研究人員可以可視化遠超過本機Python可以處理的數據集。