Repository: arrow
Updated Branches:
  refs/heads/master 010bd2245 -> b0666609a


ARROW-996: [Website] Add 0.3.0 release announce in Japanese

Author: Kouhei Sutou <k...@clear-code.com>

Closes #668 from kou/website-0.3-release-announce-japanese and squashes the 
following commits:

cc7871f [Kouhei Sutou] [Website] Add 0.3.0 release announce in Japanese


Project: http://git-wip-us.apache.org/repos/asf/arrow/repo
Commit: http://git-wip-us.apache.org/repos/asf/arrow/commit/b0666609
Tree: http://git-wip-us.apache.org/repos/asf/arrow/tree/b0666609
Diff: http://git-wip-us.apache.org/repos/asf/arrow/diff/b0666609

Branch: refs/heads/master
Commit: b0666609a2fc2e6f7bb3598972478469df0911d6
Parents: 010bd22
Author: Kouhei Sutou <k...@clear-code.com>
Authored: Thu May 11 16:51:13 2017 -0400
Committer: Wes McKinney <wes.mckin...@twosigma.com>
Committed: Thu May 11 16:51:13 2017 -0400

----------------------------------------------------------------------
 site/_posts/2017-05-08-0.3-release-japanese.md | 189 ++++++++++++++++++++
 site/_posts/2017-05-08-0.3-release.md          |   2 +
 2 files changed, 191 insertions(+)
----------------------------------------------------------------------


http://git-wip-us.apache.org/repos/asf/arrow/blob/b0666609/site/_posts/2017-05-08-0.3-release-japanese.md
----------------------------------------------------------------------
diff --git a/site/_posts/2017-05-08-0.3-release-japanese.md 
b/site/_posts/2017-05-08-0.3-release-japanese.md
new file mode 100644
index 0000000..27e0166
--- /dev/null
+++ b/site/_posts/2017-05-08-0.3-release-japanese.md
@@ -0,0 +1,189 @@
+---
+layout: post
+title: "Apache Arrow 0.3.0リリース"
+date: "2017-05-08 00:00:00 -0400"
+author: wesm
+categories: [release]
+---
+<!--
+{% comment %}
+Licensed to the Apache Software Foundation (ASF) under one or more
+contributor license agreements.  See the NOTICE file distributed with
+this work for additional information regarding copyright ownership.
+The ASF licenses this file to you under the Apache License, Version 2.0
+(the "License"); you may not use this file except in compliance with
+the License.  You may obtain a copy of the License at
+
+http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License.
+{% endcomment %}
+-->
+
+[原文(English)]({% post_url 2017-05-08-0.3-release %})
+
+Apache Arrowチーム
は0.3.0のリリースをアナウンスできてうれしいです。2月にリリースした0.2.0から10週間の活発な開発の結果が今回のリリースです。[**23人のコントリビューター**][14]が[**306個のJIRAのissueを解決**][1]しました。
+
+複数のArrowの実装にたくさんの新しい機能を追加
しています。2017年、特に注力して開発するのは、インメモリー用のフォーマット、型のメタデータ、メッセージング用のプロトコルです。これは、ビッグデータアプリケーションに**安定していてプロダクションで使える基盤**を提供するためです。高性能IOとインメモリーデータ処理にArrowを活用するために、[Apache
 
Spark][3]・[GeoMesa][2]コミュニティーと協力していてとてもエキサイティングです。
+
+それぞれのプラットフォーム
でArrowを使う方法は[インストールページ][6]を見てくだ
さい。
+
+Arrowでビッグデータシステム
を高速化するケースを増やすために、近いうちにApache 
Arrowのロードマップを公開する予定です。
+
+Arrowの開発に参加
するコントリビューターを募集しています。すでにArrowの開発に参åŠ
 
しているコミュニティーからのコントリビューターもそうですし、まã
 å‚加
していないGo、R、Juliaといったコミュニティーからのコントリビューターも募集しています。
+
+### 
ファイルフォーマットとストリーミングフォーマットの強化
+
+0.2.0では**ランダム
アクセス**用と**ストリーミング**用のArrowのワイヤーフォーマットを導å
…¥ã—ました。実装の詳細は[IPC仕様][15]を見てくだ
さい。ユースケースは[使用例を紹介したブログ][4]を見てくã
 
さい。これらのフォーマットを使うと低オーバーヘッド・コピーなしでArrowのレコードバッチのペイロードにアクセスできます。
+
+0.3.0ではこのバイナリーフォマットの細かい詳細をたくさん固めました。Java、C++、Python間の連携のテストおよびそれぞれ言語での単体テストの整備も進めました。[Google
 
Flatbuffers][5]は、前方互換性を壊さずにメタデータに新しい機能を追åŠ
 ã™ã‚‹ã®ã«éžå¸¸ã«åŠ©ã‹ã‚Šã¾ã—ãŸã€‚
+
+まだバイナリーフォーマットの前方互換性を必
ず壊さないと約束できる状æ…
‹ã§ã¯ã‚りませんが(もしかしたら変更する必
要があるなにかが見つかるかもしれない)、メジャーリリース間では不å¿
…要に互換性を壊さないように努力するつもりです。Apache 
ArrowのWebサイト、各コンポーネントのユーザー向けのドキュメントおよびAPIドキュメントへのコントリビューションを非常に歓迎します。
+
+### 辞書エンコーディングのサポート
+
+[GeoMesa][2]プロジェクトの[Emilio Lahr-Vivaz][13]はJavaのArrow実装
に辞書エンコード対応ベクターをコントリビュートしました。これを受けて、C++とPythonでもサポートしました。(`pandas.Categorical`とも連携できます。)辞書エンコーディング用のインテグレーションテスト(C++とJava間でこのデータを送受信するテスト)はまã
 å®Œæˆã—ていませんが、0.4.0までには完成させたいです。
+
+これはカテゴリーデータ用の一般的なデータ表現テクニックです。これを使うと、複数のレコードバッチでå
…±é€šã®ã€Œè¾žæ›¸ã€ã‚’å…
±æœ‰ã—、各レコードバッチの値はこの辞書を参ç…
§ã™ã‚‹æ•´æ•°ã«ãªã‚Šã¾ã™ã€‚このデータは統計的言語(statistical 
language)の分野では「カテゴリー(categorical)」や「因
子(factor)」と呼ばれています。Apache 
Parquetのようなファイルフォーマットの分野ではデータ圧縮のためã
 ã‘に使われています。
+
+### 日付、時刻、固定長型の拡張
+
+0.2.0では現実に使われている日付・時刻型をインテグレーションテスト付きで完å
…¨ã«ã‚µãƒãƒ¼ãƒˆã™ã‚‹ã“とを諦めました。これらは[Apache 
Parquet][21]とApache Sparkとの連携に必要な機能です。
+
+* **日付**: 32-bit(日単位)と64-bit(ミリ秒単位)
+* **時刻**: 
単位付き64-bit整数(単位:秒、ミリ秒、マイクロ秒、ナノ秒)
+* **タイムスタンプ(UNIXエポックからの経過時間)**: 
単位付き64-bit整数のタイムゾーン付きとタイムゾーンなし
+* **固定長バイナリー**: 
決まったバイト数のプリミティブな値
+* **固定長リスト**: 各要素が同じサイズのリスト(要素
のベクターとは別にオフセットのベクターを持つ必
要がない)
+
+C++のArrow実装
では、[Boost.Multiprecision][12]を使ったexactな小数のサポートを実験的に追åŠ
 ã—ました。ただし、Java実装とC++実装
間での小数のメモリーフォーマットはまだ
固まっていません。
+
+### C++とPythonのWindowsサポート
+
+一般的なC++とPythonでの開発用に、パッケージ周りの改良も多数å
…¥ã£ã¦ã„ます。0.3.0はVisual 
Studio(MSVC)2015と2017を使ってWindowsを完å…
¨ã«ã‚µãƒãƒ¼ãƒˆã—た最初のバージョンです。AppveyorでMSVC用のCIを実行しています。Windows上でソースからビルドするためのガイドも書きました。[C++][7]用と[Python][8]用。
+
+[conda-forge][31]からWindows用のArrowのPythonライブラリーをインストールできます。
+
+```shell
+conda install pyarrow -c conda-forge
+```
+
+### C(GLib)バインディングとRuby・Lua・他のサポート
+
+[Kouhei Sutou][9]は新しいApache 
Arrowのコントリビューターです。Linux用の(ArrowのC++実装
の)GLibを使ったCバインディングをコントリビュートしました。[GObject
 
Introspection][10]というCのミドルウェアを使うことでRuby、Lua、Goや[他にも様ã€
…なプログラミング言語][11]でシーム
レスにバインディングを使うことができます。これらのバインディングがどのように動いているか、これらのバインディングをどのように使うかを説明するブログ記事が別途å¿
…要な気がします。
+
+### PySparkを使ったApache Sparkとの連携
+
+[SPARK-13534][16]でApache 
Sparkコミュニティーと協力しています。PySparkでの`DataFrame.toPandas`をArrowを使って高速化しようとしています。効率的なデータのシリアライズにより[**40倍以上高速化**][17]できるケースがあります。
+
+PySparkでArrowを使うことでこれまでできなかったパフォーマンス最適化の道が開けました。特に、UDFの評価まわりでいろいろやれることがあるでしょう。(たとえば、Pythonのラãƒ
 ãƒ€é–¢æ•°ã‚’使って`map`・`filter`を実行するケース。)
+
+### Python実装
での新しい機能:メモリービュー、Feather、Apache 
Parquetのサポート
+
+ArrowのPythonライブラリーである`pyarrow`は`libarrow`と`libarrow_python`というC++ライブラリーのCythonバインディングです。`pyarrow`はNumPyと[pandas][29]とPythonの標準ライブラリー間のシーãƒ
 ãƒ¬ã‚¹ãªé€£æºã‚’実現します。
+
+ArrowのC++ライブラリーで最も重要なものは`arrow::Buffer`オブジェクトです。これはメモリービューを管理します。コピーなしの読み込みとスライスをサポートしている点が重要です。[Jeff
 
Knupp][25]はArrowのバッファーとPythonのバッファープロトコルとmemoryviewの連携処理をコントリビュートしました。これにより次のようなことができるようになりました。
+
+```python
+In [6]: import pyarrow as pa
+
+In [7]: buf = pa.frombuffer(b'foobarbaz')
+
+In [8]: buf
+Out[8]: <pyarrow._io.Buffer at 0x7f6c0a84b538>
+
+In [9]: memoryview(buf)
+Out[9]: <memory at 0x7f6c0a8c5e88>
+
+In [10]: buf.to_pybytes()
+Out[10]: b'foobarbaz'
+```
+
+C++でのParquet実装である[parquet-cpp][23]を使うことで大幅
に[**Apache 
Parquet**][21]サポートを改良しました。たとえば、ディスク上にあるかHDFS上にあるか関係なく、パーティションされたデータセットをサポートしました。[Daskプロジェクト][24]はArrowを使ったParquetサポートを実è£
…した最初のプロジェクトです。Dask開発者
とはpandsデータを分散処理する文脈でさらに協力できることを楽しみにしています。
+
+pandasを成熟させるためにArrowを改良することもあり、[**Featherフォーマット**][22]の実è£
…
をマージしたのもその1つです。Featherフォーマットは本質的にはArrowのランダãƒ
 
アクセスフォーマットの特別なケースの1つです。ArrowのコードベースでFeatherの開発を続けます。たとえば、今のFeatherはArrowのPythonバインディングのレイヤーを使うことでPythonのファイルオブジェクトを読み書きできるようになっています。
+
+`DatetimeTZ`や`Categorical`といったpandas固有のデータ型のちゃんとした(robust)サポートも実è£
…しました。
+
+### C++ライブラリーでのテンソルサポート
+
+Apache Arrowはコピーなしでå…
±æœ‰ãƒ¡ãƒ¢ãƒªãƒ¼ã‚’管理するツールという側面があります。機械学習アプリケーションの文脈でこの機能への関心が増えています。UCバークレーæ
 ¡ã®[RISELab][27]の[Rayプロジェクト][26]が最初の例です。
+
+機械学習ではは「テンソル」とも呼ばれる多次元é…
åˆ—というデータ構造を扱います。このようなデータ構造
はArrowのカラムフォーマットがサポートしているデータ構造
の範囲を超
えています。今回のケースでは、[`arrow::Tensor`][28]というC++の型を追åŠ
 ã§å®Ÿè£…しました。これはArrowのコピーなしのå…
±æœ‰ãƒ¡ãƒ¢ãƒªãƒ¼æ©Ÿèƒ½ã‚’活用して実装
しました。(メモリーの生存期間の管理に`arrow::Buffer`を使いました。)C++実è£
…では、これからも、å…
±é€šã®IO・メモリー管理ツールとしてArrowを活用できるようにするため、追åŠ
 ã®ãƒ‡ãƒ¼ã‚¿æ§‹é€ ã‚’提供するつもりです。
+
+### JavaScript(TypeScript)実装の開始
+
+[Brian 
Hulette][20]はNodeJSとWebブラウザー上で動くアプリケーションで使うために[TypeScript][30]でのArrowの実è£
…
を始めました。FlatBuffersがJavaScriptをファーストクラスでサポートしているので実è£
…が捗ります。
+
+### Webサイトと開発者用ドキュメントの改良
+
+0.2.0をリリースしてからドキュメントとブログをå…
¬é–‹ã™ã‚‹ãŸã‚ã«Webサイトのシステム
を[Jekyll][18]ベースで作りました。Kouhei Sutouは[Jekyll Jupyter 
Notebookプラグイン][19]を作りました。これによりArrowのWebサイトのコンテンツを作るためにJupyterを使うことができます。
+
+WebサイトにはC、C++、Java、PythonのAPIドキュメントをå…
¬é–‹ã—ました。これらの中にArrowを使い始めるための有益なæƒ
…報を見つけられるでしょう。
+
+### コントリビューター
+
+このリリースにパッチをコントリビュートしたみなさんに感謝します。
+
+```
+$ git shortlog -sn apache-arrow-0.2.0..apache-arrow-0.3.0
+    119 Wes McKinney
+     55 Kouhei Sutou
+     18 Uwe L. Korn
+     17 Julien Le Dem
+      9 Phillip Cloud
+      6 Bryan Cutler
+      5 Philipp Moritz
+      5 Emilio Lahr-Vivaz
+      4 Max Risuhin
+      4 Johan Mabille
+      4 Jeff Knupp
+      3 Steven Phillips
+      3 Miki Tebeka
+      2 Leif Walsh
+      2 Jeff Reback
+      2 Brian Hulette
+      1 Tsuyoshi Ozawa
+      1 rvernica
+      1 Nong Li
+      1 Julien Lafaye
+      1 Itai Incze
+      1 Holden Karau
+      1 Deepak Majeti
+```
+
+[1]: 
https://issues.apache.org/jira/issues/?jql=project%20%3D%20ARROW%20AND%20status%20in%20(Resolved%2C%20Closed)%20AND%20fixVersion%20%3D%200.3.0
+[2]: http://www.geomesa.org/
+[3]: http://spark.apache.org
+[4]: http://wesmckinney.com/blog/arrow-streaming-columnar/
+[5]: http://github.com/google/flatbuffers
+[6]: http://arrow.apache.org/install
+[7]: https://github.com/apache/arrow/blob/master/cpp/doc/Windows.md
+[8]: 
https://github.com/apache/arrow/blob/master/python/doc/source/development.rst
+[9]: http://github.com/kou
+[10]: https://wiki.gnome.org/Projects/GObjectIntrospection
+[11]: https://wiki.gnome.org/Projects/GObjectIntrospection/Users
+[12]: https://github.com/boostorg/multiprecision
+[13]: https://github.com/elahrvivaz
+[14]: https://github.com/apache/arrow/graphs/contributors
+[15]: http://arrow.apache.org/docs/ipc.html
+[16]: https://issues.apache.org/jira/browse/SPARK-13534
+[17]: https://github.com/apache/spark/pull/15821#issuecomment-282175163
+[18]: https://jekyllrb.com
+[19]: https://github.com/red-data-tools/jekyll-jupyter-notebook
+[20]: https://github.com/TheNeuralBit
+[21]: http://parquet.apache.org
+[22]: https://github.com/wesm/feather
+[23]: https://github.com/apache/parquet-cpp
+[24]: 
https://github.com/dask/dask/commit/68f9e417924a985c1f2e2a587126833c70a2e9f4
+[25]: https://github.com/JeffKnupp
+[26]: https://github.com/ray-project/ray
+[27]: https://rise.cs.berkeley.edu/
+[28]: http://arrow.apache.org/docs/cpp/classarrow_1_1_tensor.html
+[29]: http://pandas.pydata.org
+[30]: https://github.com/apache/arrow/tree/master/js
+[31]: https://conda-forge.github.io

http://git-wip-us.apache.org/repos/asf/arrow/blob/b0666609/site/_posts/2017-05-08-0.3-release.md
----------------------------------------------------------------------
diff --git a/site/_posts/2017-05-08-0.3-release.md 
b/site/_posts/2017-05-08-0.3-release.md
index 5f80e62..39a907d 100644
--- a/site/_posts/2017-05-08-0.3-release.md
+++ b/site/_posts/2017-05-08-0.3-release.md
@@ -24,6 +24,8 @@ limitations under the License.
 {% endcomment %}
 -->
 
+Translations: [日本語]({% post_url 2017-05-08-0.3-release-japanese %})
+
 The Apache Arrow team is pleased to announce the 0.3.0 release of the
 project. It is the product of an intense 10 weeks of development since the
 0.2.0 release from this past February. It includes [**306 resolved JIRAs**][1]

Reply via email to