Самый быстрый способ определить, является ли квадратный корень из целого числа целым числом

John D. Cook

17-го ноября 2008 в 2:27

Дополнительно

Вы'll должны сделать некоторые бенчмаркинг. Лучший алгоритм будет зависеть от распределения входных данных.

Ваш алгоритм может быть почти оптимальным, но вы можете сделать быструю проверку, чтобы исключить некоторые возможности, прежде чем звонить корень квадратный рутины. Например, посмотрите на последнюю цифру вашего номера в hex делать немного-Мудрый "и.&идеальный квадратов может закончиться только в 0, 1, 4, или 9 по основанию 16, Так что 75% от вашего вклада (предполагая, что они распределены равномерно) вы можете избежать вызова квадратного корня в обмен на некоторые очень быстрый бит сложа.

Кип протестированные следующий код реализует шестигранные трюк. При тестировании чисел от 1 до 100,000,000, этот код побежал в два раза быстрее оригинала.

public final static boolean isPerfectSquare(long n)
{
    if (n < 0)
        return false;

    switch((int)(n & 0xF))
    {
    case 0: case 1: case 4: case 9:
        long tst = (long)Math.sqrt(n);
        return tst*tst == n;

    default:
        return false;
    }
}

Когда я тестировал аналогичный код на C++, на самом деле она побежала медленнее, чем оригинал. Однако, когда я ликвидировал оператор switch, шестигранные трюк еще раз сделать код в два раза быстрее.

int isPerfectSquare(int n)
{
    int h = n & 0xF;  // h is the last hex "digit"
    if (h > 9)
        return 0;
    // Use lazy evaluation to jump out of the if statement as soon as possible
    if (h != 2 && h != 3 && h != 5 && h != 6 && h != 7 && h != 8)
    {
        int t = (int) floor( sqrt((double) n) + 0.5 );
        return t*t == n;
    }
    return 0;
}

Исключения оператора switch незначительно повлияло на код C#.

129

Newton's method - Wikipedia

chakrit

17-го ноября 2008 в 1:50

Дополнительно

Я думал о тех ужасных временах, которые я провел на курсе "Численный анализ".

И тут я вспомнил, что была одна функция, кружащаяся по 'сети из исходного кода Quake:

float Q_rsqrt( float number )
{
  long i;
  float x2, y;
  const float threehalfs = 1.5F;

  x2 = number * 0.5F;
  y  = number;
  i  = * ( long * ) &y;  // evil floating point bit level hacking
  i  = 0x5f3759df - ( i >> 1 ); // wtf?
  y  = * ( float * ) &i;
  y  = y * ( threehalfs - ( x2 * y * y ) ); // 1st iteration
  // y  = y * ( threehalfs - ( x2 * y * y ) ); // 2nd iteration, this can be removed

  #ifndef Q3_VM
  #ifdef __linux__
    assert( !isnan(y) ); // bk010122 - FPE?
  #endif
  #endif
  return y;
}

которая в основном вычисляет квадратный корень, используя функцию аппроксимации Ньютона (не помню точного названия).

Она должна быть пригодна для использования и даже может быть быстрее, она из одной из феноменальных игр id Software!

Он написан на C++, но не должно быть слишком сложно повторить ту же технику на Java, когда вы поймете идею:

Изначально я нашел его на: http://www.codemaestro.com/reviews/9

Метод Ньютона объясняется в Википедии: http://en.wikipedia.org/wiki/Newton%27s_method

Вы можете перейти по ссылке для более подробного объяснения того, как это работает, но если вас это не очень волнует, то это примерно то, что я помню из чтения блога и из курса "Численный анализ":

* (long*) &y - это, по сути, функция быстрого преобразования в длинные числа, чтобы можно было применять целочисленные операции к необработанным байтам.
строка 0x5f3759df - (i >> 1); - это предварительно вычисленное начальное значение для функции аппроксимации.
строка * (float*) &i преобразует значение обратно в плавающую точку.
строка y = y * ( threehalfs - ( x2 * y * y ) в основном итерирует значение над функцией снова.

Функция аппроксимации дает тем более точные значения, чем больше итераций функции над результатом. В случае с Quake одна итерация - это "достаточно хорошо", но если это не так... то вы можете добавить столько итераций, сколько вам нужно.

Это должно быть быстрее, поскольку сокращает количество операций деления, выполняемых в наивном квадратичном корне, до простого деления на 2 (фактически операция умножения * 0.5F) и заменяет их несколькими фиксированными операциями умножения.

en.wikipedia.org

50

Jon Skeet

17-го ноября 2008 в 1:50

Дополнительно

Если вы выполняете бинарное преобразование, пытаясь найти "правильный" квадратный корень, вы можете довольно легко определить, достаточно ли близко полученное вами значение:

(n+1)^2 = n^2 + 2n + 1
(n-1)^2 = n^2 - 2n + 1

Итак, вычислив n^2, можно выбрать следующие варианты:

n^2 = target: сделано, return true
n^2 + 2n + 1 > target > n^2 : вы'близки, но это'не идеально: return false
n^2 - 2n + 1 < target < n^2 : ditto
target < n^2 - 2n + 1 : двоичная отбивка на меньшем n
target > n^2 + 2n + 1 : двоичная отбивка по большему n

(Извините, здесь используется n как ваше текущее предположение, а target как параметр. Прошу прощения за путаницу!)

Я не знаю, будет ли это быстрее или нет, но попробовать стоит.

EDIT: Двоичное сокращение не обязательно должно принимать весь диапазон целых чисел, также как и (2^x)^2 = 2^(2x), так что как только вы найдете верхний бит набора в вашей цели (что можно сделать с помощью трюка с перестановкой битов; я забыл, как именно), вы можете быстро получить диапазон потенциальных ответов. Имейте в виду, что наивное двоичное преобразование все равно займет не более 31 или 32 итераций.

34

durron597

10-го июня 2013 в 4:39

Дополнительно

Я провел анализ нескольких алгоритмов в этой теме и придумал некоторые новые результаты. Вы можете посмотреть эти старые результаты в изменение истории этого ответа, но они'повторно не точная, так как я допустил ошибку и потратили время анализа нескольких алгоритмов, которые еще't закройте. Однако, вытягивать уроки из несколько разных ответов, у меня теперь есть два алгоритма, которые давят на "победитель" из этого потока. Здесь'ы главное я сделал по-другому, чем все остальные:

// This is faster because a number is divisible by 2^4 or more only 6% of the time
// and more than that a vanishingly small percentage.
while((x & 0x3) == 0) x >>= 2;
// This is effectively the same as the switch-case statement used in the original
// answer. 
if((x & 0x7) != 1) return false;

Однако, эта простая линия, которая большую часть времени добавляет один или два очень быстро объяснят, что значительно упрощает переключения заявление в случае, если заявление. Однако, он может добавить к выполнения если многие проверенные цифры имеют значительные мощности-из-двух факторов.

Приведенные ниже алгоритмы являются следующие:

Интернет - Кип's отвечал ответить
Durron - мой измененный ответ с помощью однопроходной ответа в качестве базы
DurronTwo - мой измененный ответ через два-передать ответ (@JohnnyHeggheim), с некоторыми другими незначительными изменениями.

Вот пример выполнения, если цифры генерируются с помощью математика.АБС(Ява.утиль.Случайные.nextLong())`

 0% Scenario{vm=java, trial=0, benchmark=Internet} 39673.40 ns; ?=378.78 ns @ 3 trials
33% Scenario{vm=java, trial=0, benchmark=Durron} 37785.75 ns; ?=478.86 ns @ 10 trials
67% Scenario{vm=java, trial=0, benchmark=DurronTwo} 35978.10 ns; ?=734.10 ns @ 10 trials

benchmark   us linear runtime
 Internet 39.7 ==============================
   Durron 37.8 ============================
DurronTwo 36.0 ===========================

vm: java
trial: 0

А вот пример выполнения, если это's запускает на Первом только миллионов тоскует:

 0% Scenario{vm=java, trial=0, benchmark=Internet} 2933380.84 ns; ?=56939.84 ns @ 10 trials
33% Scenario{vm=java, trial=0, benchmark=Durron} 2243266.81 ns; ?=50537.62 ns @ 10 trials
67% Scenario{vm=java, trial=0, benchmark=DurronTwo} 3159227.68 ns; ?=10766.22 ns @ 3 trials

benchmark   ms linear runtime
 Internet 2.93 ===========================
   Durron 2.24 =====================
DurronTwo 3.16 ==============================

vm: java
trial: 0

Как вы можете видеть, DurronTwo делает лучше для больших входов, потому что он добирается, чтобы использовать фокус очень часто, но будет повреждена по сравнению с первым алгоритмом и математике.корень, потому что эти цифры намного меньше. Между тем, проще Durron огромная победителем, потому что он не имеет деления на 4 много много раз в первый миллион цифр.

Здесь'ы Durron:

public final static boolean isPerfectSquareDurron(long n) {
    if(n < 0) return false;
    if(n == 0) return true;

    long x = n;
    // This is faster because a number is divisible by 16 only 6% of the time
    // and more than that a vanishingly small percentage.
    while((x & 0x3) == 0) x >>= 2;
    // This is effectively the same as the switch-case statement used in the original
    // answer. 
    if((x & 0x7) == 1) {

        long sqrt;
        if(x < 410881L)
        {
            int i;
            float x2, y;

            x2 = x * 0.5F;
            y  = x;
            i  = Float.floatToRawIntBits(y);
            i  = 0x5f3759df - ( i >> 1 );
            y  = Float.intBitsToFloat(i);
            y  = y * ( 1.5F - ( x2 * y * y ) );

            sqrt = (long)(1.0F/y);
        } else {
            sqrt = (long) Math.sqrt(x);
        }
        return sqrt*sqrt == x;
    }
    return false;
}

И DurronTwo

public final static boolean isPerfectSquareDurronTwo(long n) {
    if(n < 0) return false;
    // Needed to prevent infinite loop
    if(n == 0) return true;

    long x = n;
    while((x & 0x3) == 0) x >>= 2;
    if((x & 0x7) == 1) {
        long sqrt;
        if (x < 41529141369L) {
            int i;
            float x2, y;

            x2 = x * 0.5F;
            y = x;
            i = Float.floatToRawIntBits(y);
            //using the magic number from 
            //http://www.lomont.org/Math/Papers/2003/InvSqrt.pdf
            //since it more accurate
            i = 0x5f375a86 - (i >> 1);
            y = Float.intBitsToFloat(i);
            y = y * (1.5F - (x2 * y * y));
            y = y * (1.5F - (x2 * y * y)); //Newton iteration, more accurate
            sqrt = (long) ((1.0F/y) + 0.2);
        } else {
            //Carmack hack gives incorrect answer for n >= 41529141369.
            sqrt = (long) Math.sqrt(x);
        }
        return sqrt*sqrt == x;
    }
    return false;
}

И мой тест проводов (требуется Google штангенциркуль 0.1-проект RC5)

public class SquareRootBenchmark {
    public static class Benchmark1 extends SimpleBenchmark {
        private static final int ARRAY_SIZE = 10000;
        long[] trials = new long[ARRAY_SIZE];

        @Override
        protected void setUp() throws Exception {
            Random r = new Random();
            for (int i = 0; i < ARRAY_SIZE; i++) {
                trials[i] = Math.abs(r.nextLong());
            }
        }

        public int timeInternet(int reps) {
            int trues = 0;
            for(int i = 0; i < reps; i++) {
                for(int j = 0; j < ARRAY_SIZE; j++) {
                    if(SquareRootAlgs.isPerfectSquareInternet(trials[j])) trues++;
                }
            }

            return trues;   
        }

        public int timeDurron(int reps) {
            int trues = 0;
            for(int i = 0; i < reps; i++) {
                for(int j = 0; j < ARRAY_SIZE; j++) {
                    if(SquareRootAlgs.isPerfectSquareDurron(trials[j])) trues++;
                }
            }

            return trues;   
        }

        public int timeDurronTwo(int reps) {
            int trues = 0;
            for(int i = 0; i < reps; i++) {
                for(int j = 0; j < ARRAY_SIZE; j++) {
                    if(SquareRootAlgs.isPerfectSquareDurronTwo(trials[j])) trues++;
                }
            }

            return trues;   
        }
    }

    public static void main(String... args) {
        Runner.main(Benchmark1.class, args);
    }
}

Обновление: Я'ве сделали новый алгоритм, который работает быстрее, в некоторых случаях, в других-медленнее, Я'ве получили различные критерии, основанные на разных входов. Если мы вычисляем остаток от деления цвет 0xffffff = 3 х 3 х 5 х 7 х 13 х 17 х 241, мы можем исключить 97.82% чисел, которые не могут быть квадратами. Это можно (вроде) сделать в одну строчку, с 5 побитовые операции:

if (!goodLookupSquares[(int) ((n & 0xFFFFFFl) + ((n >> 24) & 0xFFFFFFl) + (n >> 48))]) return false;

В результате индекс является либо 1) осадок, 2) остаток + цвет 0xffffff, или 3) остаток + 0x1FFFFFE. Конечно, мы должны иметь таблицы подстановки для цвет 0xffffff по модулю остатков, которая составляет около 3 МБ файл (в этом случае хранятся в виде чисел текст десятичный код ASCII, не оптимальный, но явно недоказуемое с ByteBuffer и так далее. Но поскольку это предвычислил ее не'т так много значат. Файл можно найти здесь (или создайте ее сами):

public final static boolean isPerfectSquareDurronThree(long n) {
    if(n < 0) return false;
    if(n == 0) return true;

    long x = n;
    while((x & 0x3) == 0) x >>= 2;
    if((x & 0x7) == 1) {
        if (!goodLookupSquares[(int) ((n & 0xFFFFFFl) + ((n >> 24) & 0xFFFFFFl) + (n >> 48))]) return false;
        long sqrt;
        if(x < 410881L)
        {
            int i;
            float x2, y;

            x2 = x * 0.5F;
            y  = x;
            i  = Float.floatToRawIntBits(y);
            i  = 0x5f3759df - ( i >> 1 );
            y  = Float.intBitsToFloat(i);
            y  = y * ( 1.5F - ( x2 * y * y ) );

            sqrt = (long)(1.0F/y);
        } else {
            sqrt = (long) Math.sqrt(x);
        }
        return sqrt*sqrt == x;
    }
    return false;
}

Я загрузить его в логическое массив такой:

private static boolean[] goodLookupSquares = null;

public static void initGoodLookupSquares() throws Exception {
    Scanner s = new Scanner(new File("24residues_squares.txt"));

    goodLookupSquares = new boolean[0x1FFFFFE];

    while(s.hasNextLine()) {
        int residue = Integer.valueOf(s.nextLine());
        goodLookupSquares[residue] = true;
        goodLookupSquares[residue + 0xFFFFFF] = true;
        goodLookupSquares[residue + 0x1FFFFFE] = true;
    }

    s.close();
}

Пример выполнения. Он бил Durron (версия одна) в каждый суд, который я побежал.

 0% Scenario{vm=java, trial=0, benchmark=Internet} 40665.77 ns; ?=566.71 ns @ 10 trials
33% Scenario{vm=java, trial=0, benchmark=Durron} 38397.60 ns; ?=784.30 ns @ 10 trials
67% Scenario{vm=java, trial=0, benchmark=DurronThree} 36171.46 ns; ?=693.02 ns @ 10 trials

  benchmark   us linear runtime
   Internet 40.7 ==============================
     Durron 38.4 ============================
DurronThree 36.2 ==========================

vm: java
trial: 0

23

Cyrille Ka

2-го декабря 2008 в 10:00

Дополнительно

Просто для записи, другой подход заключается в использовании премьер-разложения. Если каждый коэффициент разложения четное, то число является полным квадратом. Так что вы хотите, чтобы увидеть, если число можно разложить как произведение квадраты простых чисел. Конечно, вы Дон'т необходимость получить такое разложение, просто чтобы увидеть, если она существует.

Сначала построить таблицу квадратов простых чисел, которые меньше, чем 2^32. Это намного меньше, чем в таблице все числа до этой границы.

Тогда решение будет таким:

boolean isPerfectSquare(long number)
{
    if (number < 0) return false;
    if (number < 2) return true;

    for (int i = 0; ; i++)
    {
        long square = squareTable[i];
        if (square > number) return false;
        while (number % square == 0)
        {
            number /= square;
        }
        if (number == 1) return true;
    }
}

Я думаю, это'немного загадочным. Что она делает это, проверяя на каждом шагу, что квадрат простого числа делить число входных. Если это так, то он делит число на площади так долго, как это возможно, чтобы удалить эту площадь от премьер-разложения. Если на этот процесс, мы пришли к 1, то входное число разложение квадратного из простых чисел. Если площадь будет больше, чем сам номер, то ни в коем случае это квадрат, или каких-либо больших площадей, могут его поделить, поэтому количество не может быть разложение на квадраты простых чисел.

Учитывая, сегодня' корень сделано в аппаратных и нужно вычислить вот простых чисел, я думаю, это решение намного медленнее. Но она должна дать лучшие результаты, чем решение с функция sqrt, которая выиграла'т работу над 2^54, Как говорит mrzl в ответ.

12

Редактировал ответ 13-го июля 2014 в 7:24

dfeuer

13-го июля 2014 в 10:17

Дополнительно

Следующее упрощение maaartinus'ы решение появляется бриться несколько процентных пунктов от выполнения, но я'м не достаточно хорош на контрольных показателей, чтобы произвести тест, которому я могу доверять:

long goodMask; // 0xC840C04048404040 computed below
{
    for (int i=0; i<64; ++i) goodMask |= Long.MIN_VALUE >>> (i*i);
}

public boolean isSquare(long x) {
    // This tests if the 6 least significant bits are right.
    // Moving the to be tested bit to the highest position saves us masking.
    if (goodMask << x >= 0) return false;
    // Remove an even number of trailing zeros, leaving at most one.
    x >>= (Long.numberOfTrailingZeros(x) & (-2);
    // Repeat the test on the 6 least significant remaining bits.
    if (goodMask << x >= 0 | x <= 0) return x == 0;
    // Do it in the classical way.
    // The correctness is not trivial as the conversion from long to double is lossy!
    final long tst = (long) Math.sqrt(x);
    return tst * tst == x;
}

Стоило бы проверить, насколько опуская первое испытание,

if (goodMask << x >= 0) return false;

будет влиять на производительность.

dfeuer

9

finnw

6-го мая 2010 в 1:29

Дополнительно

Это самая быстрая реализация Java, который я мог придумать, используя комбинацию методов, предложенных другими в этой теме.

Мод-256 тест
Неточное мод-3465 тест (позволяет избежать целочисленного деления на стоимость некоторых ложных срабатываний)
С плавающей точкой квадратный корень, круглые и сравнить с входным значением

Я также экспериментировал с этими изменениями, но они не помогали производительности:

Дополнительный мод-255 тест
Разделение входного значения силы 4
Быстрый инверсный квадратный корень (для работы при высоких значениях N он должен 3 итераций достаточно, чтобы сделать его медленнее, чем аппаратная функция квадратного корня.)

<Р/>

public class SquareTester {

    public static boolean isPerfectSquare(long n) {
        if (n < 0) {
            return false;
        } else {
            switch ((byte) n) {
            case -128: case -127: case -124: case -119: case -112:
            case -111: case -103: case  -95: case  -92: case  -87:
            case  -79: case  -71: case  -64: case  -63: case  -60:
            case  -55: case  -47: case  -39: case  -31: case  -28:
            case  -23: case  -15: case   -7: case    0: case    1:
            case    4: case    9: case   16: case   17: case   25:
            case   33: case   36: case   41: case   49: case   57:
            case   64: case   65: case   68: case   73: case   81:
            case   89: case   97: case  100: case  105: case  113:
            case  121:
                long i = (n * INV3465) >>> 52;
                if (! good3465[(int) i]) {
                    return false;
                } else {
                    long r = round(Math.sqrt(n));
                    return r*r == n; 
                }
            default:
                return false;
            }
        }
    }

    private static int round(double x) {
        return (int) Double.doubleToRawLongBits(x + (double) (1L << 52));
    }

    /** 3465<sup>-1</sup> modulo 2<sup>64</sup> */
    private static final long INV3465 = 0x8ffed161732e78b9L;

    private static final boolean[] good3465 =
        new boolean[0x1000];

    static {
        for (int r = 0; r < 3465; ++ r) {
            int i = (int) ((r * r * INV3465) >>> 52);
            good3465[i] = good3465[i+1] = true;
        }
    }

}

8

David Lehavi

1-го января 2009 в 10:12

Дополнительно

Вы должны избавиться от 2-силовая часть Н с самого начала.

2-е изд Магическое выражение для м ниже должны быть

m = N - (N & (N-1));

а не как написано

Конец 2-е изд

m = N & (N-1); // the lawest bit of N
N /= m;
byte = N & 0x0F;
if ((m % 2) || (byte !=1 && byte !=9))
  return false;

1-й изменения:

Незначительные улучшения:

m = N & (N-1); // the lawest bit of N
N /= m;
if ((m % 2) || (N & 0x07 != 1))
  return false;

Конец 1-го правка

Теперь продолжится как обычно. Таким образом, к тому времени вы добираетесь, чтобы с плавающей запятой часть, вы уже избавились от всех чисел, 2-силовая часть нечетные (около половины), а затем рассматривать только 1/8 часть, что осталось. Т. е. вы запустите с плавающей запятой часть на 6% чисел.

7

Brent.Longborough

1-го января 2009 в 10:27

Дополнительно

Это переделки из десятичной в двоичную старого алгоритма калькулятора Маршан (к сожалению, я не'Т есть ссылка), в Ruby, адаптированные специально для этого вопроса:

def isexactsqrt(v)
    value = v.abs
    residue = value
    root = 0
    onebit = 1
    onebit <<= 8 while (onebit < residue)
    onebit >>= 2 while (onebit > residue)
    while (onebit > 0)
        x = root + onebit
        if (residue >= x) then
            residue -= x
            root = x + onebit
        end
        root >>= 1
        onebit >>= 2
    end
    return (residue == 0)
end

Здесь'ы обследования что-то подобное (пожалуйста, Дон'т голосовать меня за стиль кодирования/запахи или неуклюжим О/О - это'ы алгоритм, который рассчитывает, и C++ не мой родной язык). В этом случае, мы'вновь искать остаток == 0:

#include <iostream>  

using namespace std;  
typedef unsigned long long int llint;

class ISqrt {           // Integer Square Root
    llint value;        // Integer whose square root is required
    llint root;         // Result: floor(sqrt(value))
    llint residue;      // Result: value-root*root
    llint onebit, x;    // Working bit, working value

public:

    ISqrt(llint v = 2) {    // Constructor
        Root(v);            // Take the root 
    };

    llint Root(llint r) {   // Resets and calculates new square root
        value = r;          // Store input
        residue = value;    // Initialise for subtracting down
        root = 0;           // Clear root accumulator

        onebit = 1;                 // Calculate start value of counter
        onebit <<= (8*sizeof(llint)-2);           // Set up counter bit as greatest odd power of 2 
        while (onebit > residue) {onebit >>= 2; }; // Shift down until just < value

        while (onebit > 0) {
            x = root ^ onebit;          // Will check root+1bit (root bit corresponding to onebit is always zero)
            if (residue >= x) {          // Room to subtract?
                residue -= x;           // Yes - deduct from residue
                root = x + onebit;      // and step root
            };
            root >>= 1;
            onebit >>= 2;
        };
        return root;                    
    };
    llint Residue() {           // Returns residue from last calculation
        return residue;                 
    };
};

int main() {
    llint big, i, q, r, v, delta;
    big = 0; big = (big-1);         // Kludge for "big number"
    ISqrt b;                            // Make q sqrt generator
    for ( i = big; i > 0 ; i /= 7 ) {    // for several numbers
        q = b.Root(i);                  // Get the square root
        r = b.Residue();                // Get the residue
        v = q*q+r;                      // Recalc original value
        delta = v-i;                    // And diff, hopefully 0
        cout << i << ": " << q << " ++ " << r << " V: " << v << " Delta: " << delta << "\n";
    };
    return 0;
};

6

Jonny Heggheim

25-го мая 2009 в 1:22

Дополнительно

Мне нравится идея использовать почти правильный способ на некоторых входных данных. Вот версия с более высоким "в зачет" по. Код, кажется, работает и проходит мой простой тестовый случай.

Просто заменить:

if(n < 410881L){...}

код с этим:

if (n < 11043908100L) {
    //John Carmack hack, converted to Java.
    // See: http://www.codemaestro.com/reviews/9
    int i;
    float x2, y;

    x2 = n * 0.5F;
    y = n;
    i = Float.floatToRawIntBits(y);
    //using the magic number from 
    //http://www.lomont.org/Math/Papers/2003/InvSqrt.pdf
    //since it more accurate
    i = 0x5f375a86 - (i >> 1);
    y = Float.intBitsToFloat(i);
    y = y * (1.5F - (x2 * y * y));
    y = y * (1.5F - (x2 * y * y)); //Newton iteration, more accurate

    sqrt = Math.round(1.0F / y);
} else {
    //Carmack hack gives incorrect answer for n >= 11043908100.
    sqrt = (long) Math.sqrt(n);
}

6

11-го марта 2009 в 1:25

Дополнительно

Этот корень называют не вполне точным, как уже было сказано, но это'ы интересна и поучительна, что он не'т удар от других ответов с точки зрения скорости. В конце концов, последовательность инструкции языка ассемблера для неотрицательных крошечный. Intel имеет аппаратную инструкция, которой нет'т используется Java-я считаю, что это не'т соответствовать стандарту IEEE.

Так почему это медленно? Потому что Java-это на самом деле вызов процедуры на C через JNI, и он'ов на самом деле медленнее, чем в вызов Java подпрограмму, которая сама по себе медленнее, чем встроенные. Это очень раздражает, и Java следовало бы придумать лучшего решения, т. е. строят в плавучей библиотеке точка звонки, если это необходимо. Да ладно.

В C++, я подозреваю, что все сложные альтернативы проигрывают по скорости, но я еще'т проверил их все. То, что я сделал, и что Ява люди найдут полезный, простой лайфхак, расширения, проведения специальной проверки случае предложенной А. Рекс. Использовать один длинный значение как битовый массив, что это'т границы проверяется. Таким образом, Вы имеете 64-разрядный логический поиск.

typedef unsigned long long UVLONG
UVLONG pp1,pp2;

void init2() {
  for (int i = 0; i < 64; i++) {
    for (int j = 0; j < 64; j++)
      if (isPerfectSquare(i * 64 + j)) {
    pp1 |= (1 << j);
    pp2 |= (1 << i);
    break;
      }
   }
   cout << "pp1=" << pp1 << "," << pp2 << "\n";  
}

inline bool isPerfectSquare5(UVLONG x) {
  return pp1 & (1 << (x & 0x3F)) ? isPerfectSquare(x) : false;
}

Рутинную isPerfectSquare5 работает в около 1/3 времени сердечником2 машина дуэта. Я подозреваю, что дальнейших изменений в том же духе может еще больше сократить время на среднем, но каждый раз, когда вы проверяете, Вы торгуете больше испытывать дополнительные исключения, так что вы можете't идти слишком далеко по этому пути.

Конечно, вместо того, чтобы иметь отдельный тест отрицательный, вы можете проверить высокий 6 бит одинаково.

Обратите внимание, что все, что я'м делаю исключения возможных квадратов, но когда у меня есть потенциальный случай, если мне придется назвать оригинальным, isPerfectSquare встроен.

В init2 процедура вызывается один раз для инициализации статического значения РР1 и рр2. Обратите внимание, что в моей реализации в C++, я'м через неподписанные долго долго, что вы'вновь подписали, вы'd должны использовать >>> оператор.

Нет внутренней необходимости, чтобы проверить границы массива, но Java'ы оптимизатора со всем этим разобраться довольно быстро, так что я не'т винить их за это.

6

Похожие сообщества 24

Physics.Math.Code

7 314 пользователей

VK: vk.com/physics_math Библиотека: @physics_lib Заметки репетитора: @mentor_it Канал по безопасности: @hack_theory Советские учебные фильмы: @maths_lib YouTube: youtube.com/c/PhysicsMathCode Помощь в решении: vk.com/itmentor Админ: @physicist_i

pro.jvm

6 791 пользователей

Сообщество разработчиков Java Scala Kotlin Groovy Clojure Чат для нач-их: @javastart Наш канал: @proJVM Вакансии: @jvmjobs @jvmjobschat ⚠️ Оффтоп -> @flood ❌Переход на личности ❌Троллинг ❌Реклама ❌HH (вакансии) ❌Варез

learn.java

5 542 пользователей

Чат для начинающих и не только Статистика: https://combot.org/chat/-1001083535868 Основной чат - @jvmchat

Java & Co

4 430 пользователей

Можно обсуждать с матом и без всё, что касается жабы, вплоть до холиваров. НЕ ИМЕЕТ ОТНОШЕНИЯ К САЙТУ JAVARUSH.RU ПРАВИЛА - https://t.me/javarush/179171 Вакансии сюда - https://telegram.me/joinchat/B7IzvUCnfo6d8t3yIxKguQ По вопросам - @thedude

pro.JVM Jobs Chat

2 812 пользователей

Чат для обсуждения вакансий на JVM языках. Правила: - Никакого спама - Никакого троллинга и оскорблений участников - Размещение вакансий только через канал Канал для вакансий: @jvmjobs Основной чат: @jvmchat Наши друзья: @scala_jobs, @scala_jobs_feed

Java/Kotlin and more

2 321 пользователей

чат о Java/Kotlin и связанных технологиях. We're discussing: job, tech questions etc. languages: russian, java, eng, kotlin Ссылка на чат: t.me/springframeworkio

Зарегистрирован 4 недели назад

Добавить вопрос

Категории

Все

Технологий

Культура / Отдых

Жизнь / Искусство

Наука

Профессии

Бизнес

Пользователи

1

2

Артур «Апер»

3

Viktor Malyutin

4

Viktor Malyutin

5

Syahputra Zhedenk