Quel est le meilleur moyen de créer et de peupler un tableau de nombres?

Question

J'ai vu de nombreuses façons différentes de créer et de peupler un tableau de nombres. Cependant, quel est le meilleur moyen de créer et d’en peupler un? Avec "meilleur" étant défini du plus important au moins important:

Table créée avec une indexation optimale
les lignes générées le plus rapidement
code simple utilisé pour créer et peupler

Si vous ne savez pas ce qu'est une table de nombres, regardez ici: Pourquoi devrais-je envisager d'utiliser une table de nombres auxiliaire?

KM. · Accepted Answer

voici quelques exemples de code tirés du Web et des réponses à cette question.

Pour chaque méthode, j'ai modifié le code d'origine afin que chacune utilise la même table et la même colonne: NumbersTest et Number, avec 10 000 lignes ou le plus proche possible. En outre, j'ai fourni des liens vers le lieu d'origine.

METHOD 1 voici une méthode de boucle très lente de ici
moy 13,01 secondes
a couru 3 fois plus haut, voici les temps en secondes: 12.42, 13.60

DROP TABLE NumbersTest DECLARE @RunDate datetime SET @RunDate=GETDATE() CREATE TABLE NumbersTest(Number INT IDENTITY(1,1)) SET NOCOUNT ON WHILE COALESCE(SCOPE_IDENTITY(), 0) < 100000 BEGIN INSERT dbo.NumbersTest DEFAULT VALUES END SET NOCOUNT OFF -- Add a primary key/clustered index to the numbers table ALTER TABLE NumbersTest ADD CONSTRAINT PK_NumbersTest PRIMARY KEY CLUSTERED (Number) PRINT CONVERT(varchar(20),datediff(ms,@RunDate,GETDATE())/1000.0)+' seconds' SELECT COUNT(*) FROM NumbersTest

METHOD 2 voici une boucle beaucoup plus rapide de ici
avg 1.1658 secondes
couru 11 fois plus élevé, voici les temps en secondes: 1.117, 1.140, 1.203, 1.170, 1.173, 1.156, 1.203, 1.153, 1.173, 1.170

DROP TABLE NumbersTest DECLARE @RunDate datetime SET @RunDate=GETDATE() CREATE TABLE NumbersTest (Number INT NOT NULL); DECLARE @i INT; SELECT @i = 1; SET NOCOUNT ON WHILE @i <= 10000 BEGIN INSERT INTO dbo.NumbersTest(Number) VALUES (@i); SELECT @i = @i + 1; END; SET NOCOUNT OFF ALTER TABLE NumbersTest ADD CONSTRAINT PK_NumbersTest PRIMARY KEY CLUSTERED (Number) PRINT CONVERT(varchar(20),datediff(ms,@RunDate,GETDATE())/1000.0)+' seconds' SELECT COUNT(*) FROM NumbersTest

METHOD 3 Voici un INSERT unique basé sur le code de ici
moy 488,6 millisecondes
courue 11 fois plus haut, voici des temps en millisecondes: 686, 673, 623, 686,343,343,376,360,343,453

DROP TABLE NumbersTest DECLARE @RunDate datetime SET @RunDate=GETDATE() CREATE TABLE NumbersTest (Number int not null) ;WITH Nums(Number) AS (SELECT 1 AS Number UNION ALL SELECT Number+1 FROM Nums where Number<10000 ) insert into NumbersTest(Number) select Number from Nums option(maxrecursion 10000) ALTER TABLE NumbersTest ADD CONSTRAINT PK_NumbersTest PRIMARY KEY CLUSTERED (Number) PRINT CONVERT(varchar(20),datediff(ms,@RunDate,GETDATE()))+' milliseconds' SELECT COUNT(*) FROM NumbersTest

METHOD 4 voici une méthode "semi-bouclée" de ici Avg 348,3 millisecondes (il était difficile d'obtenir un bon timing en raison du "GO" au milieu du code, des suggestions serait apprécié)
a couru 11 fois plus haut, voici des temps en millisecondes: 356, 360, 283, 346, 360, 376, 326, 373, 330, 373

DROP TABLE NumbersTest DROP TABLE #RunDate CREATE TABLE #RunDate (RunDate datetime) INSERT INTO #RunDate VALUES(GETDATE()) CREATE TABLE NumbersTest (Number int NOT NULL); INSERT NumbersTest values (1); GO --required INSERT NumbersTest SELECT Number + (SELECT COUNT(*) FROM NumbersTest) FROM NumbersTest GO 14 --will create 16384 total rows ALTER TABLE NumbersTest ADD CONSTRAINT PK_NumbersTest PRIMARY KEY CLUSTERED (Number) SELECT CONVERT(varchar(20),datediff(ms,RunDate,GETDATE()))+' milliseconds' FROM #RunDate SELECT COUNT(*) FROM NumbersTest

METHODE 5 voici un seul INSERT de réponse de Philip Kelley
moy 92,7 millisecondes
a couru 11 fois plus haut, voici des temps en millisecondes: 80, 96, 96, 93, 110, 110, 80, 76, 93, 93

DROP TABLE NumbersTest DECLARE @RunDate datetime SET @RunDate=GETDATE() CREATE TABLE NumbersTest (Number int not null) ;WITH Pass0 as (select 1 as C union all select 1), --2 rows Pass1 as (select 1 as C from Pass0 as A, Pass0 as B),--4 rows Pass2 as (select 1 as C from Pass1 as A, Pass1 as B),--16 rows Pass3 as (select 1 as C from Pass2 as A, Pass2 as B),--256 rows Pass4 as (select 1 as C from Pass3 as A, Pass3 as B),--65536 rows --I removed Pass5, since I'm only populating the Numbers table to 10,000 Tally as (select row_number() over(order by C) as Number from Pass4) INSERT NumbersTest (Number) SELECT Number FROM Tally WHERE Number <= 10000 ALTER TABLE NumbersTest ADD CONSTRAINT PK_NumbersTest PRIMARY KEY CLUSTERED (Number) PRINT CONVERT(varchar(20),datediff(ms,@RunDate,GETDATE()))+' milliseconds' SELECT COUNT(*) FROM NumbersTest

METHOD 6 voici un seul INSERT de Mladen Prajdic answer
moy 82,3 millisecondes
a couru 11 fois plus haut, voici des temps en millisecondes: 80, 80, 93, 76, 93, 63, 93, 76, 93, 76

DROP TABLE NumbersTest DECLARE @RunDate datetime SET @RunDate=GETDATE() CREATE TABLE NumbersTest (Number int not null) INSERT INTO NumbersTest(Number) SELECT TOP 10000 row_number() over(order by t1.number) as N FROM master..spt_values t1 CROSS JOIN master..spt_values t2 ALTER TABLE NumbersTest ADD CONSTRAINT PK_NumbersTest PRIMARY KEY CLUSTERED (Number); PRINT CONVERT(varchar(20),datediff(ms,@RunDate,GETDATE()))+' milliseconds' SELECT COUNT(*) FROM NumbersTest

METHOD 7 voici un seul INSERT basé sur le code de ici
moy 56,3 millisecondes
a couru 11 fois plus haut, voici des temps en millisecondes: 63, 50, 63, 46, 60, 63, 63, 46, 63, 46

DROP TABLE NumbersTest DECLARE @RunDate datetime SET @RunDate=GETDATE() SELECT TOP 10000 IDENTITY(int,1,1) AS Number INTO NumbersTest FROM sys.objects s1 --use sys.columns if you don't get enough rows returned to generate all the numbers you need CROSS JOIN sys.objects s2 --use sys.columns if you don't get enough rows returned to generate all the numbers you need ALTER TABLE NumbersTest ADD CONSTRAINT PK_NumbersTest PRIMARY KEY CLUSTERED (Number) PRINT CONVERT(varchar(20),datediff(ms,@RunDate,GETDATE()))+' milliseconds' SELECT COUNT(*) FROM NumbersTest

Après avoir examiné toutes ces méthodes, j’aime beaucoup la Méthode 7, la plus rapide et le code assez simple.

Mladen Prajdic · Answer

j'utilise ce qui est rapide comme l'enfer:

insert into Numbers(N) select top 1000000 row_number() over(order by t1.number) as N from master..spt_values t1 cross join master..spt_values t2

Bacon Bits · Answer

Si vous faites cela dans SQL Server Management Studio ou sqlcmd, vous pouvez utiliser le fait que le séparateur de lot vous permet de répéter le lot:

CREATE TABLE Number (N INT IDENTITY(1,1) PRIMARY KEY NOT NULL); GO INSERT INTO Number DEFAULT VALUES; GO 100000

Cela insérera 100 000 enregistrements dans la table Numbers.

C'est lent. Cela se compare à METHOD 1 dans la réponse de @ KM., Qui est le plus lent des exemples. Cependant, c'est à peu près aussi lumineux que possible. Vous pourriez accélérer quelque peu en ajoutant la contrainte de clé primaire après le lot d'insertion.

Philip Kelley · Answer

Je commence par le modèle suivant, qui est dérivé de nombreuses impressions de la routine d'Itzik Ben-Gan:

;WITH Pass0 as (select 1 as C union all select 1), --2 rows Pass1 as (select 1 as C from Pass0 as A, Pass0 as B),--4 rows Pass2 as (select 1 as C from Pass1 as A, Pass1 as B),--16 rows Pass3 as (select 1 as C from Pass2 as A, Pass2 as B),--256 rows Pass4 as (select 1 as C from Pass3 as A, Pass3 as B),--65536 rows Pass5 as (select 1 as C from Pass4 as A, Pass4 as B),--4,294,967,296 rows Tally as (select row_number() over(order by C) as Number from Pass5) select Number from Tally where Number <= 1000000

La clause "WHERE N <= 1000000" limite la sortie à 1 million, et peut facilement être ajustée à la plage souhaitée.

Puisqu'il s'agit d'une clause WITH, elle peut être insérée dans un INSERT ... SELECT ... comme ceci:

-- Sample use: create one million rows CREATE TABLE dbo.Example (ExampleId int not null) DECLARE @RowsToCreate int SET @RowsToCreate = 1000000 -- "Table of numbers" data generator, as per Itzik Ben-Gan (from multiple sources) ;WITH Pass0 as (select 1 as C union all select 1), --2 rows Pass1 as (select 1 as C from Pass0 as A, Pass0 as B),--4 rows Pass2 as (select 1 as C from Pass1 as A, Pass1 as B),--16 rows Pass3 as (select 1 as C from Pass2 as A, Pass2 as B),--256 rows Pass4 as (select 1 as C from Pass3 as A, Pass3 as B),--65536 rows Pass5 as (select 1 as C from Pass4 as A, Pass4 as B),--4,294,967,296 rows Tally as (select row_number() over(order by C) as Number from Pass5) INSERT Example (ExampleId) select Number from Tally where Number <= @RowsToCreate

L'indexation de la table après sa construction sera le moyen le plus rapide de l'indexer.

Oh, et j'appellerais cela une table "Tally". Je pense que c'est un terme courant, et vous pouvez trouver une foule de trucs et d'exemples en le recherchant sur Google.

Denis Pitcher · Answer

Pour ceux qui recherchent une solution Azure

SET NOCOUNT ON CREATE TABLE Numbers (n bigint PRIMARY KEY) GO DECLARE @numbers table(number int); WITH numbers(number) as ( SELECT 1 AS number UNION all SELECT number+1 FROM numbers WHERE number<10000 ) INSERT INTO @numbers(number) SELECT number FROM numbers OPTION(maxrecursion 10000) INSERT INTO Numbers(n) SELECT number FROM @numbers

Source: blog de l'équipe SQL Azure http://Azure.Microsoft.com/blog/2010/09/16/create-a-numbers-table-in-sql-Azure/

Alex · Answer

Voici quelques méthodes supplémentaires:
Méthode 1

IF OBJECT_ID('dbo.Numbers', 'U') IS NOT NULL DROP TABLE dbo.Numbers GO CREATE TABLE Numbers (Number int NOT NULL PRIMARY KEY); GO DECLARE @i int = 1; INSERT INTO dbo.Numbers (Number) VALUES (1),(2); WHILE 2*@i < 1048576 BEGIN INSERT INTO dbo.Numbers (Number) SELECT Number + 2*@i FROM dbo.Numbers; SET @i = @@ROWCOUNT; END GO SELECT COUNT(*) FROM Numbers AS RowCownt --1048576 rows

Méthode 2

IF OBJECT_ID('dbo.Numbers', 'U') IS NOT NULL DROP TABLE dbo.Numbers GO CREATE TABLE dbo.Numbers (Number int NOT NULL PRIMARY KEY); GO DECLARE @i INT = 0; INSERT INTO dbo.Numbers (Number) VALUES (1); WHILE @i <= 9 BEGIN INSERT INTO dbo.Numbers (Number) SELECT N.Number + POWER(4, @i) * D.Digit FROM dbo.Numbers AS N CROSS JOIN (VALUES(1),(2),(3)) AS D(Digit) ORDER BY D.Digit, N.Number SET @i = @i + 1; END GO SELECT COUNT(*) FROM dbo.Numbers AS RowCownt --1048576 rows

Méthode 3

IF OBJECT_ID('dbo.Numbers', 'U') IS NOT NULL DROP TABLE dbo.Numbers GO CREATE TABLE Numbers (Number int identity NOT NULL PRIMARY KEY, T bit NULL); WITH T1(T) AS (SELECT T FROM (VALUES (1),(2),(3),(4),(5),(6),(7),(8),(9),(10)) AS T(T)) --10 rows ,T2(T) AS (SELECT A.T FROM T1 AS A CROSS JOIN T1 AS B CROSS JOIN T1 AS C) --1,000 rows ,T3(T) AS (SELECT A.T FROM T2 AS A CROSS JOIN T2 AS B CROSS JOIN T2 AS C) --1,000,000,000 rows INSERT INTO dbo.Numbers(T) SELECT TOP (1048576) NULL FROM T3; ALTER TABLE Numbers DROP COLUMN T; GO SELECT COUNT(*) FROM dbo.Numbers AS RowCownt --1048576 rows

Méthode 4, extrait de Programmation de bases de données défensives livre de Alex Kuznetsov

IF OBJECT_ID('dbo.Numbers', 'U') IS NOT NULL DROP TABLE dbo.Numbers GO CREATE TABLE Numbers (Number int NOT NULL PRIMARY KEY); GO DECLARE @i INT = 1 ; INSERT INTO dbo.Numbers (Number) VALUES (1); WHILE @i < 524289 --1048576 BEGIN; INSERT INTO dbo.Numbers (Number) SELECT Number + @i FROM dbo.Numbers; SET @i = @i * 2 ; END GO SELECT COUNT(*) FROM dbo.Numbers AS RowCownt --1048576 rows

Méthode 5, extrait de Tableaux et listes dans SQL Server 2005 et versions ultérieures article de Erland Sommarskog

IF OBJECT_ID('dbo.Numbers', 'U') IS NOT NULL DROP TABLE dbo.Numbers GO CREATE TABLE Numbers (Number int NOT NULL PRIMARY KEY); GO WITH digits (d) AS ( SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9 UNION ALL SELECT 0) INSERT INTO Numbers (Number) SELECT Number FROM (SELECT i.d + ii.d * 10 + iii.d * 100 + iv.d * 1000 + v.d * 10000 + vi.d * 100000 AS Number FROM digits i CROSS JOIN digits ii CROSS JOIN digits iii CROSS JOIN digits iv CROSS JOIN digits v CROSS JOIN digits vi) AS Numbers WHERE Number > 0 GO SELECT COUNT(*) FROM dbo.Numbers AS RowCownt --999999 rows

Résumé:
Parmi ces 5 méthodes, la méthode 3 semble être la plus rapide.

paxdiablo · Answer

J'utilise des tableaux de chiffres pour créer principalement des rapports dans BIRT sans avoir à manipuler la création dynamique de jeux d'enregistrements.

Je fais la même chose avec les dates, avec un tableau allant de 10 ans dans le passé à 10 ans dans l’avenir (et les heures de la journée pour des rapports plus détaillés). Il est très astucieux de pouvoir obtenir des valeurs pour toutes dates même si vos "véritables" tables de données ne contiennent pas de données pour elles.

J'ai un script que je utilise pour créer ceux-ci, quelque chose comme (c'est de mémoire):

drop table numbers; commit; create table numbers (n integer primary key); commit; insert into numbers values (0); commit; insert into numbers select n+1 from numbers; commit; insert into numbers select n+2 from numbers; commit; insert into numbers select n+4 from numbers; commit; insert into numbers select n+8 from numbers; commit; insert into numbers select n+16 from numbers; commit; insert into numbers select n+32 from numbers; commit; insert into numbers select n+64 from numbers; commit;

Le nombre de lignes double avec chaque ligne, de sorte qu'il ne faut pas beaucoup pour produire des tables vraiment énormes.

Je ne suis pas sûr d'être d'accord avec vous sur le fait qu'il est important d'être créé rapidement, car vous ne le créez qu'une fois. Le coût de cette opération est amorti sur tous les accès, ce qui le rend assez insignifiant.

Luke Kubat · Answer

Je sais que ce fil est ancien et a répondu, mais il existe un moyen de tirer un peu plus de performances de la méthode 7:

Au lieu de cela (essentiellement la méthode 7 mais avec une certaine facilité d'utilisation, polissez):

DECLARE @BIT AS BIT = 0 IF OBJECT_ID('tempdb..#TALLY') IS NOT NULL DROP TABLE #TALLY DECLARE @RunDate datetime SET @RunDate=GETDATE() SELECT TOP 10000 IDENTITY(int,1,1) AS Number INTO #TALLY FROM sys.objects s1 --use sys.columns if you don't get enough rows returned to generate all the numbers you need CROSS JOIN sys.objects s2 --use sys.co ALTER TABLE #TALLY ADD PRIMARY KEY(Number) PRINT CONVERT(varchar(20),datediff(ms,@RunDate,GETDATE()))+' milliseconds'

Essaye ça:

DECLARE @BIT AS BIT = 0 IF OBJECT_ID('tempdb..#TALLY') IS NOT NULL DROP TABLE #TALLY DECLARE @RunDate datetime SET @RunDate=GETDATE() SELECT TOP 10000 IDENTITY(int,1,1) AS Number INTO #TALLY FROM (SELECT @BIT [X] UNION ALL SELECT @BIT) [T2] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T4] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T8] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T16] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T32] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T64] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T128] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T256] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T512] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T1024] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T2048] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T4096] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T8192] CROSS JOIN (SELECT @BIT [X] UNION ALL SELECT @BIT) [T16384] ALTER TABLE #TALLY ADD PRIMARY KEY(Number) PRINT CONVERT(varchar(20),datediff(ms,@RunDate,GETDATE()))+' milliseconds'

Sur mon serveur, cela prend environ 10 ms, par opposition à environ 16-20 ms lorsque vous sélectionnez sys.objects. Il présente également l'avantage supplémentaire de ne pas dépendre du nombre d'objets contenus dans sys.objects. Bien que ce soit assez sûr, c'est techniquement une dépendance et l'autre va de toute façon plus vite. Je pense que l’augmentation de la vitesse dépend de l’utilisation des bits si vous changez:

DECLARE @BIT AS BIT = 0

à:

DECLARE @BIT AS BIGINT = 0

Cela ajoute environ 8 à 10 ms au temps total passé sur mon serveur. Cela dit, lorsque vous augmentez votre stock jusqu'à 1 000 000 enregistrements, BIT vs BIGINT n'affecte plus sensiblement ma requête, mais il tourne toujours autour de ~ 680ms vs ~ 730ms de sys.objects.

iliketocode · Answer

Voici une solution courte et rapide en mémoire que j'ai proposée avec les constructeurs de table Valued Table introduits dans SQL Server 2008:

--1,000,000 rows. Either add/remove CROSS JOINs, or use TOP clause to modify this ;WITH v AS (SELECT * FROM (VALUES(0),(0),(0),(0),(0),(0),(0),(0),(0),(0)) v(z)) SELECT N FROM (SELECT ROW_NUMBER() OVER (ORDER BY v1.z)-1 N FROM v v1 CROSS JOIN v v2 CROSS JOIN v v3 CROSS JOIN v v4 CROSS JOIN v v5 CROSS JOIN v v6) Nums

Notez que cela peut être rapidement calculé à la volée, ou (encore mieux) stocké dans une table permanente (ajoutez simplement une clause INTO après le segment SELECT N) avec une clé primaire dans le champ N pour une efficacité améliorée.

Piotr Spikowski · Answer

Certaines des méthodes suggérées se basent sur des objets système (par exemple, sur les «sys.objects»). Ils supposent que ces objets système contiennent suffisamment d'enregistrements pour générer nos numéros.

Je ne m'appuierais sur aucun élément n'appartenant pas à mon application et sur lequel je n'ai pas le contrôle total. Par exemple: le contenu de ces tables sys peut changer, les tables peuvent ne plus être valides dans la nouvelle version de SQL, etc.

En tant que solution, nous pouvons créer notre propre table avec des enregistrements. Nous utilisons ensuite celui-ci à la place de ces objets liés au système (le tableau avec tous les nombres devrait convenir si nous connaissons la plage à l'avance, sinon nous pourrions choisir celui qui fera la jointure croisée).

La solution basée sur le CTE fonctionne bien, mais elle a des limites liées aux boucles imbriquées.

Mike S · Answer

Il s'agit d'un reconditionnement de la réponse acceptée - mais d'une manière qui vous permet de les comparer les uns pour les autres - les 3 algorithmes les plus performants sont comparés (et les commentaires expliquent pourquoi d'autres méthodes sont exclues) et vous pouvez exécuter votre propre configuration Voyez comment ils fonctionnent chacun avec la taille de séquence que vous désirez.

SET NOCOUNT ON; -- -- Set the count of numbers that you want in your sequence ... -- DECLARE @NumberOfNumbers int = 10000000; -- -- Some notes on choosing a useful length for your sequence ... -- For a sequence of 100 numbers -- winner depends on preference of min/max/avg runtime ... (I prefer PhilKelley algo here - edit the algo so RowSet2 is max RowSet CTE) -- For a sequence of 1k numbers -- winner depends on preference of min/max/avg runtime ... (Sadly PhilKelley algo is generally lowest ranked in this bucket, but could be tweaked to perform better) -- For a sequence of 10k numbers -- a clear winner emerges for this bucket -- For a sequence of 100k numbers -- do not test any looping methods at this size or above ... -- the previous winner fails, a different method is need to guarantee the full sequence desired -- For a sequence of 1MM numbers -- the statistics aren't changing much between the algorithms - choose one based on your own goals or tweaks -- For a sequence of 10MM numbers -- only one of the methods yields the desired sequence, and the numbers are much closer than for smaller sequences DECLARE @TestIteration int = 0; DECLARE @MaxIterations int = 10; DECLARE @MethodName varchar(128); -- SQL SERVER 2017 Syntax/Support needed DROP TABLE IF EXISTS #TimingTest CREATE TABLE #TimingTest (MethodName varchar(128), TestIteration int, StartDate DateTime2, EndDate DateTime2, ElapsedTime decimal(38,0), ItemCount decimal(38,0), MaxNumber decimal(38,0), MinNumber decimal(38,0)) -- -- Conduct the test ... -- WHILE @TestIteration < @MaxIterations BEGIN -- Be sure that the test moves forward SET @TestIteration += 1; /* -- This method has been removed, as it is BY FAR, the slowest method -- This test shows that, looping should be avoided, likely at all costs, if one places a value / premium on speed of execution ... -- -- METHOD - Fast looping -- -- Prep for the test DROP TABLE IF EXISTS [Numbers].[Test]; CREATE TABLE [Numbers].[Test] (Number INT NOT NULL); -- Method information SET @MethodName = 'FastLoop'; -- Record the start of the test INSERT INTO #TimingTest(MethodName, TestIteration, StartDate) SELECT @MethodName, @TestIteration, GETDATE() -- Run the algorithm DECLARE @i INT = 1; WHILE @i <= @NumberOfNumbers BEGIN INSERT INTO [Numbers].[Test](Number) VALUES (@i); SELECT @i = @i + 1; END; ALTER TABLE [Numbers].[Test] ADD CONSTRAINT PK_Numbers_Test_Number PRIMARY KEY CLUSTERED (Number) -- Record the end of the test UPDATE tt SET EndDate = GETDATE() FROM #TimingTest tt WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration -- And the stats about the numbers in the sequence UPDATE tt SET ItemCount = results.ItemCount, MaxNumber = results.MaxNumber, MinNumber = results.MinNumber FROM #TimingTest tt CROSS JOIN ( SELECT COUNT(Number) as ItemCount, MAX(Number) as MaxNumber, MIN(Number) as MinNumber FROM [Numbers].[Test] ) results WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration */ /* -- This method requires GO statements, which would break the script, also - this answer does not appear to be the fastest *AND* seems to perform "magic" -- -- METHOD - "Semi-Looping" -- -- Prep for the test DROP TABLE IF EXISTS [Numbers].[Test]; CREATE TABLE [Numbers].[Test] (Number INT NOT NULL); -- Method information SET @MethodName = 'SemiLoop'; -- Record the start of the test INSERT INTO #TimingTest(MethodName, TestIteration, StartDate) SELECT @MethodName, @TestIteration, GETDATE() -- Run the algorithm INSERT [Numbers].[Test] values (1); -- GO --required INSERT [Numbers].[Test] SELECT Number + (SELECT COUNT(*) FROM [Numbers].[Test]) FROM [Numbers].[Test] -- GO 14 --will create 16384 total rows ALTER TABLE [Numbers].[Test] ADD CONSTRAINT PK_Numbers_Test_Number PRIMARY KEY CLUSTERED (Number) -- Record the end of the test UPDATE tt SET EndDate = GETDATE() FROM #TimingTest tt WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration -- And the stats about the numbers in the sequence UPDATE tt SET ItemCount = results.ItemCount, MaxNumber = results.MaxNumber, MinNumber = results.MinNumber FROM #TimingTest tt CROSS JOIN ( SELECT COUNT(Number) as ItemCount, MAX(Number) as MaxNumber, MIN(Number) as MinNumber FROM [Numbers].[Test] ) results WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration */ -- -- METHOD - Philip Kelley's algo -- (needs tweaking to match the desired length of sequence in order to optimize its performance, relies more on the coder to properly Tweak the algorithm) -- -- Prep for the test DROP TABLE IF EXISTS [Numbers].[Test]; CREATE TABLE [Numbers].[Test] (Number INT NOT NULL); -- Method information SET @MethodName = 'PhilKelley'; -- Record the start of the test INSERT INTO #TimingTest(MethodName, TestIteration, StartDate) SELECT @MethodName, @TestIteration, GETDATE() -- Run the algorithm ; WITH RowSet0 as (select 1 as Item union all select 1), -- 2 rows -- We only have to name the column in the first select, the second/union select inherits the column name RowSet1 as (select 1 as Item from RowSet0 as A, RowSet0 as B), -- 4 rows RowSet2 as (select 1 as Item from RowSet1 as A, RowSet1 as B), -- 16 rows RowSet3 as (select 1 as Item from RowSet2 as A, RowSet2 as B), -- 256 rows RowSet4 as (select 1 as Item from RowSet3 as A, RowSet3 as B), -- 65536 rows (65k) RowSet5 as (select 1 as Item from RowSet4 as A, RowSet4 as B), -- 4294967296 rows (4BB) -- Add more RowSetX to get higher and higher numbers of rows -- Each successive RowSetX results in squaring the previously available number of rows Tally as (select row_number() over (order by Item) as Number from RowSet5) -- This is what gives us the sequence of integers, always select from the terminal CTE expression -- Note: testing of this specific use case has shown that making Tally as a sub-query instead of a terminal CTE expression is slower (always) - be sure to follow this pattern closely for max performance INSERT INTO [Numbers].[Test] (Number) SELECT o.Number FROM Tally o WHERE o.Number <= @NumberOfNumbers ALTER TABLE [Numbers].[Test] ADD CONSTRAINT PK_Numbers_Test_Number PRIMARY KEY CLUSTERED (Number) -- Record the end of the test UPDATE tt SET EndDate = GETDATE() FROM #TimingTest tt WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration -- And the stats about the numbers in the sequence UPDATE tt SET ItemCount = results.ItemCount, MaxNumber = results.MaxNumber, MinNumber = results.MinNumber FROM #TimingTest tt CROSS JOIN ( SELECT COUNT(Number) as ItemCount, MAX(Number) as MaxNumber, MIN(Number) as MinNumber FROM [Numbers].[Test] ) results WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration -- -- METHOD - Mladen Prajdic answer -- -- Prep for the test DROP TABLE IF EXISTS [Numbers].[Test]; CREATE TABLE [Numbers].[Test] (Number INT NOT NULL); -- Method information SET @MethodName = 'MladenPrajdic'; -- Record the start of the test INSERT INTO #TimingTest(MethodName, TestIteration, StartDate) SELECT @MethodName, @TestIteration, GETDATE() -- Run the algorithm INSERT INTO [Numbers].[Test](Number) SELECT TOP (@NumberOfNumbers) row_number() over(order by t1.number) as N FROM master..spt_values t1 CROSS JOIN master..spt_values t2 ALTER TABLE [Numbers].[Test] ADD CONSTRAINT PK_Numbers_Test_Number PRIMARY KEY CLUSTERED (Number) -- Record the end of the test UPDATE tt SET EndDate = GETDATE() FROM #TimingTest tt WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration -- And the stats about the numbers in the sequence UPDATE tt SET ItemCount = results.ItemCount, MaxNumber = results.MaxNumber, MinNumber = results.MinNumber FROM #TimingTest tt CROSS JOIN ( SELECT COUNT(Number) as ItemCount, MAX(Number) as MaxNumber, MIN(Number) as MinNumber FROM [Numbers].[Test] ) results WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration -- -- METHOD - Single INSERT -- -- Prep for the test DROP TABLE IF EXISTS [Numbers].[Test]; -- The Table creation is part of this algorithm ... -- Method information SET @MethodName = 'SingleInsert'; -- Record the start of the test INSERT INTO #TimingTest(MethodName, TestIteration, StartDate) SELECT @MethodName, @TestIteration, GETDATE() -- Run the algorithm SELECT TOP (@NumberOfNumbers) IDENTITY(int,1,1) AS Number INTO [Numbers].[Test] FROM sys.objects s1 -- use sys.columns if you don't get enough rows returned to generate all the numbers you need CROSS JOIN sys.objects s2 -- use sys.columns if you don't get enough rows returned to generate all the numbers you need ALTER TABLE [Numbers].[Test] ADD CONSTRAINT PK_Numbers_Test_Number PRIMARY KEY CLUSTERED (Number) -- Record the end of the test UPDATE tt SET EndDate = GETDATE() FROM #TimingTest tt WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration -- And the stats about the numbers in the sequence UPDATE tt SET ItemCount = results.ItemCount, MaxNumber = results.MaxNumber, MinNumber = results.MinNumber FROM #TimingTest tt CROSS JOIN ( SELECT COUNT(Number) as ItemCount, MAX(Number) as MaxNumber, MIN(Number) as MinNumber FROM [Numbers].[Test] ) results WHERE tt.MethodName = @MethodName and tt.TestIteration = @TestIteration END -- Calculate the timespan for each of the runs UPDATE tt SET ElapsedTime = DATEDIFF(MICROSECOND, StartDate, EndDate) FROM #TimingTest tt -- -- Report the results ... -- SELECT MethodName, AVG(ElapsedTime) / AVG(ItemCount) as TimePerRecord, CAST(AVG(ItemCount) as bigint) as SequenceLength, MAX(ElapsedTime) as MaxTime, MIN(ElapsedTime) as MinTime, MAX(MaxNumber) as MaxNumber, MIN(MinNumber) as MinNumber FROM #TimingTest tt GROUP by tt.MethodName ORDER BY TimePerRecord ASC, MaxTime ASC, MinTime ASC