なぜPython3にはxrange関数がないのですか？

Question

さらに

catalesia

質問

なぜPython3にはxrange関数がないのですか？

最近、Python3を使い始めたのですが、xrangeがないのが痛いですね。

簡単な例です。

*1)** Python2:

from time import time as t
def count():
  st = t()
  [x for x in xrange(10000000) if x%4 == 0]
  et = t()
  print et-st
count()

2) Python3:

from time import time as t

def xrange(x):

    return iter(range(x))

def count():
    st = t()
    [x for x in xrange(10000000) if x%4 == 0]
    et = t()
    print (et-st)
count()

結果は、それぞれ

1) 1.53888392448 2) 3.215819835662842

なんでだろう？というか、なぜxrange'が削除されたのか？こんなに素晴らしいツールがあったんですね。私のような初心者にとっては、誰もがどこかでそうだったように。なぜ削除されたのでしょうか？誰か適切なPEPを教えてくれませんか、見つかりません。

ありがとうございます。

Air

編集された質問 2日 5月 2014 в 5:38

プログラミング

python

python-3.x

pep

xrange

解決策・回答

John La Rooy

22日 2月 2013 в 1:09

さらに

Python3'のrange is Python2'のxrangeです。iterを囲む必要はありません。Python3で実際のリストを取得するには、 list(range(...)) を使う必要があります。

もし、Python2とPython3で動作するものが欲しい場合は、次のようにしてみてください。

try:
    xrange
except NameError:
    xrange = range

136

0

Blckknght

21日 2月 2013 в 11:42

さらに

Python 3 の range 型は Python 2 の xrange と同様に動作します。なぜ遅くなるのかよくわかりません。なぜならば、xrange関数が返すイテレータは、rangeを直接イテレートした場合に得られるものと同じだからです。

私のシステムでは速度低下を再現することができません。以下は私がテストした方法です。

Python 2, xrange を使用。

Python 2.7.3 (default, Apr 10 2012, 23:24:47) [MSC v.1500 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> import timeit
>>> timeit.timeit("[x for x in xrange(1000000) if x%4]",number=100)
18.631936646865853

Python 3, with range はほんの少しだけ速くなります。

Python 3.3.0 (v3.3.0:bd8afb90ebf2, Sep 29 2012, 10:57:17) [MSC v.1600 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> import timeit
>>> timeit.timeit("[x for x in range(1000000) if x%4]",number=100)
17.31399508687869

最近知ったのですが、Python 3 の range 型には、スライスのサポートなど、他にもいくつかの優れた機能があります。例えば、range(10,100,2)[5:25:5] は range(20, 60, 10)!

Blckknght

編集した答え 22日 6月 2019 в 4:57

16

0

質問の追加

カテゴリ

すべて

技術情報

文化・レクリエーション

生活・芸術

科学

プロフェッショナル

事業内容

ユーザー

すべて

新しい

人気

1

2

3

4

5

Do you have a question? Add it on the site and get an answer instantly

ja.kzen.dev

abarnert · Accepted Answer · 2013-02-22T00:03:10+00:00

いくつかのパフォーマンス測定では、timeを使って手動で行う代わりに、timeitを使用しています。

まず、Apple 2.7.2 64ビット。

In [37]: %timeit collections.deque((x for x in xrange(10000000) if x%4 == 0), maxlen=0)
1 loops, best of 3: 1.05 s per loop

今度はpython.org 3.3.0 64bitです。

In [83]: %timeit collections.deque((x for x in range(10000000) if x%4 == 0), maxlen=0)
1 loops, best of 3: 1.32 s per loop

In [84]: %timeit collections.deque((x for x in xrange(10000000) if x%4 == 0), maxlen=0)
1 loops, best of 3: 1.31 s per loop

In [85]: %timeit collections.deque((x for x in iter(range(10000000)) if x%4 == 0), maxlen=0) 
1 loops, best of 3: 1.33 s per loop

どうやら、3.xのrangeは2.xのxrangeよりも本当に少し遅いようです。そして、OPのxrange関数はそれとは関係ありません。(驚くことではありません。__iter__スロットへの1回限りの呼び出しは、ループ内で起こることへの10000000回の呼び出しの中では見えそうにありませんが、誰かが可能性としてそれを持ち出しました)。

でも，30%しか遅くなりません。なぜOPは2倍遅くなったのか？32ビットのPythonで同じテストを繰り返すと、1.58対3.12という結果になりました。私の推測では、これは 3.x が 64 ビットのパフォーマンスのために最適化されていて、32 ビットに悪影響を与えているケースの一つではないかと思います。

しかし、それが本当に重要なのでしょうか？3.3.0 を 64 ビットに戻してチェックしてみましょう。

In [86]: %timeit [x for x in range(10000000) if x%4 == 0]
1 loops, best of 3: 3.65 s per loop

つまり、listの構築には、反復処理全体の2倍以上の時間がかかるのです。

また、「Python 2.6+よりもはるかに多くのリソースを消費する」についてですが、私のテストによると、3.xのrangeは2.xのxrangeとまったく同じ大きさのようで、仮に10倍の大きさであったとしても、不要なリストを構築することは、rangeの反復でできることよりも10000000倍ほど問題が大きいです。

また、dequeの中のCループの代わりに、明示的なforループはどうでしょうか？

In [87]: def consume(x):
   ....:     for i in x:
   ....:         pass
In [88]: %timeit consume(x for x in range(10000000) if x%4 == 0)
1 loops, best of 3: 1.85 s per loop

つまり、for文で、rangeを反復する実際の作業とほぼ同じだけの時間を無駄にしているのです。

もしあなたが range オブジェクトの反復処理の最適化を心配しているのであれば、それはおそらく間違った場所を見ているのでしょう。

一方、あなたは何度同じことを言われても、なぜxrangeが削除されたのかと聞き続けていますが、もう一度言います。削除されたのではなく、rangeに改名されたのであり、2.xのrangeこそが削除されたのです。

3.3 range オブジェクトが、2.x xrange オブジェクトの直系の子孫であることを証明するものがあります (2.x range 関数の子孫ではありません)。3.3 range]1と2.7 xrangeのソースです。また、変更履歴も見ることができます（ファイル内の最後の文字列 "xrange" を置き換えた変更にリンクされていると思います）。

では、なぜ遅くなったのでしょうか？

それは、たくさんの新機能が追加されたからです。もうひとつは、細かい副作用のある変更をあちこちで（特に繰り返しの中で）行っていることが挙げられます。また、重要ではないケースをわずかに悲観的にすることがあっても、重要なケースを劇的に最適化するために多くの作業が行われてきました。これらを総合すると、`範囲をできるだけ速く反復することが、今では少し遅くなっていることに驚きはありません。これは、誰もが注目するほど重要ではないケースのひとつです。現実のユースケースで、この性能差がコードのホットスポットになるような人はいないでしょう。