Der schnellste Weg, um festzustellen, ob die Quadratwurzel einer ganzen Zahl eine ganze Zahl ist

Question

Mehr

Frage

Der schnellste Weg, um festzustellen, ob die Quadratwurzel einer ganzen Zahl eine ganze Zahl ist

Ich suche nach dem schnellsten Weg, um festzustellen, ob ein "langer" Wert ein perfektes Quadrat ist (d.h. seine Quadratwurzel ist eine andere ganze Zahl):

Ich habe es auf die einfache Art gemacht, indem ich die eingebaute Math.sqrt() Funktion, aber ich frage mich, ob es einen Weg gibt, es schneller zu machen, indem man indem man sich auf den Integer-Bereich beschränkt.
Das Führen einer Nachschlagetabelle ist unpraktisch (da es etwa 2^31.5 ganze Zahlen gibt, deren Quadrat kleiner als 2⁶³ ist).

Hier ist die sehr einfache und geradlinige Art und Weise, wie ich es jetzt mache:

public final static boolean isPerfectSquare(long n)
{
  if (n < 0)
    return false;

  long tst = (long)(Math.sqrt(n) + 0.5);
  return tst*tst == n;
}

_{Hinweis: Ich'verwende diese Funktion in vielen Projekt Euler Problemen. So muss niemand sonst diesen Code pflegen. Und diese Art von Mikro-Optimierung könnte tatsächlich einen Unterschied machen, da ein Teil der Herausforderung darin besteht, jeden Algorithmus in weniger als einer Minute auszuführen, und diese Funktion in einigen Problemen Millionen von Malen aufgerufen werden muss.}

Ich habe die verschiedenen Lösungen für dieses Problem ausprobiert:

Nach ausgiebigen Tests habe ich festgestellt, dass das Hinzufügen von 0,5 zum Ergebnis von Math.sqrt() nicht notwendig ist, zumindest nicht auf meinem Rechner.
Die schnelle inverse Quadratwurzel war schneller, lieferte aber falsche Ergebnisse für n >= 410881. Wie jedoch von BobbyShaftoe vorgeschlagen, können wir den FISR-Hack für n < 410881 verwenden.
Newtons Methode war ein gutes Stück langsamer als Math.sqrt(). Das liegt wahrscheinlich daran, dass Math.sqrt() etwas ähnliches wie Newton's Methode verwendet, aber in der Hardware implementiert ist, so dass sie viel schneller ist als in Java. Außerdem erforderte die Newton-Methode immer noch die Verwendung von Doubles.
Eine modifizierte Newton's-Methode, die ein paar Tricks verwendet, so dass nur Integer-Mathematik involviert war, erforderte einige Hacks, um einen Überlauf zu vermeiden (ich möchte, dass diese Funktion mit allen positiven 64-Bit-Ganzzahlen mit Vorzeichen arbeitet), und sie war immer noch langsamer als Math.sqrt().
Binary chop war sogar noch langsamer. Das macht Sinn, weil die binäre Zerlegung im Durchschnitt 16 Durchläufe benötigt, um die Quadratwurzel einer 64-Bit-Zahl zu finden.
Laut John's Tests ist die Verwendung von or-Anweisungen in C++ schneller als die Verwendung eines Switch, aber in Java und C# scheint es keinen Unterschied zwischen or und Switch zu geben.
Ich habe auch versucht, eine Nachschlagetabelle zu erstellen (als privates statisches Array mit 64 booleschen Werten). Dann würde ich statt der switch- oder or-Anweisung einfach sagen: if(lookup[(int)(n&0x3F)]) { test } else return false;. Zu meiner Überraschung war dies (nur geringfügig) langsamer. Das liegt daran, dass Array-Grenzen in Java geprüft werden.

SHoko

Bearbeitete Frage 29. Oktober 2019 в 5:00

Math (Java SE 11 & JDK 11 )

docs.oracle.com

Programmierung

java

math

optimization

perfect-square

Frage hinzufügen

Kategorien

Alle

Technologie

Kultur/Erholung

Leben/Kunst

Wissenschaft

Professionell

Unternehmen

Benutzer

Alle

Neu

Beliebt

1

Ксения Комарова

Registriert vor 4 Wochen

2

Артур «Апер»

Registriert vor 2 Monaten

3

Viktor Malyutin

Registriert vor 2 Monaten

4

Viktor Malyutin

Registriert vor 2 Monaten

5

Syahputra Zhedenk

Registriert vor 2 Monaten

Haben Sie eine Frage? Fügen Sie sie auf der Website hinzu und erhalten Sie sofort eine Antwort

de.kzen.dev

chakrit · Answer 1 · 2008-11-17T13:50:19+00:00

Ich habe über die schrecklichen Zeiten nachgedacht, die ich im Kurs Numerische Analyse verbracht habe.

Und dann erinnerte ich mich, dass da diese Funktion aus dem Quake-Quellcode im Netz kursierte:

float Q_rsqrt( float number )
{
  long i;
  float x2, y;
  const float threehalfs = 1.5F;

  x2 = number * 0.5F;
  y  = number;
  i  = * ( long * ) &y;  // evil floating point bit level hacking
  i  = 0x5f3759df - ( i >> 1 ); // wtf?
  y  = * ( float * ) &i;
  y  = y * ( threehalfs - ( x2 * y * y ) ); // 1st iteration
  // y  = y * ( threehalfs - ( x2 * y * y ) ); // 2nd iteration, this can be removed

  #ifndef Q3_VM
  #ifdef __linux__
    assert( !isnan(y) ); // bk010122 - FPE?
  #endif
  #endif
  return y;
}

Die im Grunde eine Quadratwurzel berechnet, unter Verwendung der Newtonschen Näherungsfunktion (kann mich nicht mehr an den genauen Namen erinnern).

Es sollte brauchbar sein und könnte sogar schneller sein, es ist von einem der phänomenalen id Software Spiel!

Es ist in C++ geschrieben, aber es sollte nicht zu schwer sein, die gleiche Technik in Java wiederzuverwenden, sobald Sie die Idee bekommen:

Ich habe es ursprünglich gefunden unter: http://www.codemaestro.com/reviews/9.

Newtons Methode erklärt bei wikipedia: http://en.wikipedia.org/wiki/Newton%27s_method

Sie können dem Link folgen, um mehr über die Funktionsweise zu erfahren, aber wenn Sie sich nicht dafür interessieren, dann ist das ungefähr das, woran ich mich erinnere, wenn ich den Blog lese und den Kurs "Numerische Analysis" belege:

das * (long*) &y ist im Grunde eine schnelle Konvertierung in eine lange Funktion, so dass ganzzahlige Operationen auf die rohen Bytes angewendet werden können.
Die Zeile 0x5f3759df - (i >> 1); ist ein vorberechneter Startwert für die Approximationsfunktion.
Die Zeile " (float) &i" konvertiert den Wert zurück in eine Fließkommazahl.
Die Zeile "y = y ( threehalfs - ( x2 y * y )`" iteriert den Wert erneut über die Funktion.

Die Approximationsfunktion liefert umso genauere Werte, je öfter man die Funktion über das Ergebnis iteriert. Im Fall von Quake ist eine Iteration "gut genug", aber wenn das für Sie nicht zutrifft, können Sie so viele Iterationen hinzufügen, wie Sie brauchen.

Dies sollte schneller sein, weil es die Anzahl der Divisionsoperationen, die bei der naiven quadratischen Verwurzelung durchgeführt werden, auf eine einfache Division durch 2 (eigentlich eine * 0.5F Multiplikationsoperation) reduziert und sie stattdessen durch eine feste Anzahl von Multiplikationsoperationen ersetzt.

Jon Skeet · Answer 2 · 2008-11-17T13:50:48+00:00

Wenn Sie mit einem binären Chop versuchen, die "richtige" Quadratwurzel zu finden, können Sie relativ leicht feststellen, ob der Wert nahe genug ist, um ihn zu erkennen:

(n+1)^2 = n^2 + 2n + 1
(n-1)^2 = n^2 - 2n + 1

Nachdem man also n^2 berechnet hat, gibt es folgende Möglichkeiten:

n^2 = Ziel: fertig, Rückgabe true
n^2 + 2n + 1 > target > n^2 : du bist nahe dran, aber es ist nicht perfekt: return false
n^2 - 2n + 1 < Ziel < n^2 : dito
Ziel < n^2 - 2n + 1 : Binäres Chop auf ein kleineres n
Ziel > n^2 + 2n + 1 : Binäre Zerlegung auf ein höheres n

(Entschuldigung, hier wird n als aktuelle Schätzung und target als Parameter verwendet. Ich entschuldige mich für die Verwirrung!)

Ich weiß nicht, ob dies schneller ist oder nicht, aber es ist einen Versuch wert.

EDIT: Die binäre Zerlegung muss nicht den gesamten Bereich der ganzen Zahlen berücksichtigen, auch nicht (2^x)^2 = 2^(2x), so dass man, sobald man das oberste Bit im Ziel gefunden hat (was man mit einem Bit-Twiddling-Trick machen kann; ich habe vergessen, wie genau), schnell eine Reihe von möglichen Antworten erhalten kann. Wohlgemerkt, ein naives binäres Hacken dauert immer noch nur bis zu 31 oder 32 Iterationen.

Celestial M Weasel · Answer 3 · 2008-11-17T13:48:29+00:00

Wenn Sie Geschwindigkeit wollen, da Ihre ganzen Zahlen von endlicher Größe sind, vermute ich, dass der schnellste Weg beinhalten würde (a) Partitionierung der Parameter nach Größe (z. B. in Kategorien von größten Bit gesetzt), dann überprüfen Sie den Wert gegen ein Array von perfekten Quadraten innerhalb dieses Bereichs.