Je teste un minimum d'insertions de journalisation dans différents scénarios et à partir de ce que j'ai lu INSERT INTO SELECT dans un tas avec un index non clusterisé à l'aide de TABLOCK et SQL Server 2016+ devrait se connecter de manière minimale, mais dans mon cas, lorsque je fais cela, je reçois journalisation complète. Ma base de données est dans le modèle de récupération simple et j'ai réussi à obtenir des insertions enregistrées de manière minimale sur un tas sans index et TABLOCK.
J'utilise une ancienne sauvegarde de la base de données Stack Overflow pour tester et j'ai créé une réplique de la table Posts avec le schéma suivant ...
CREATE TABLE [dbo].[PostsDestination](
[Id] [int] NOT NULL,
[AcceptedAnswerId] [int] NULL,
[AnswerCount] [int] NULL,
[Body] [nvarchar](max) NOT NULL,
[ClosedDate] [datetime] NULL,
[CommentCount] [int] NULL,
[CommunityOwnedDate] [datetime] NULL,
[CreationDate] [datetime] NOT NULL,
[FavoriteCount] [int] NULL,
[LastActivityDate] [datetime] NOT NULL,
[LastEditDate] [datetime] NULL,
[LastEditorDisplayName] [nvarchar](40) NULL,
[LastEditorUserId] [int] NULL,
[OwnerUserId] [int] NULL,
[ParentId] [int] NULL,
[PostTypeId] [int] NOT NULL,
[Score] [int] NOT NULL,
[Tags] [nvarchar](150) NULL,
[Title] [nvarchar](250) NULL,
[ViewCount] [int] NOT NULL
)
CREATE NONCLUSTERED INDEX ndx_PostsDestination_Id ON PostsDestination(Id)
J'essaie ensuite de copier le tableau des posts dans ce tableau ...
INSERT INTO PostsDestination WITH(TABLOCK)
SELECT * FROM Posts ORDER BY Id
En regardant fn_dblog et l'utilisation du fichier journal, je peux voir que je n'obtiens pas de journalisation minimale à partir de cela. J'ai lu que les versions avant 2016 nécessitent l'indicateur de trace 610 pour se connecter de manière minimale aux tables indexées, j'ai également essayé de définir cela, mais toujours pas de joie.
Je suppose que je manque quelque chose ici?
EDIT - Plus d'informations
Pour ajouter plus d'informations, j'utilise la procédure suivante que j'ai écrite pour essayer de détecter une journalisation minimale, peut-être que j'ai quelque chose de mal ici ...
/*
Example Usage...
EXEC sp_GetLogUseStats
@Sql = '
INSERT INTO PostsDestination
SELECT TOP 500000 * FROM Posts ORDER BY Id ',
@Schema = 'dbo',
@Table = 'PostsDestination',
@ClearData = 1
*/
CREATE PROCEDURE [dbo].[sp_GetLogUseStats]
(
@Sql NVARCHAR(400),
@Schema NVARCHAR(20),
@Table NVARCHAR(200),
@ClearData BIT = 0
)
AS
IF @ClearData = 1
BEGIN
TRUNCATE TABLE PostsDestination
END
/*Checkpoint to clear log (Assuming Simple/Bulk Recovery Model*/
CHECKPOINT
/*Snapshot of logsize before query*/
CREATE TABLE #BeforeLogUsed(
[Db] NVARCHAR(100),
LogSize NVARCHAR(30),
Used NVARCHAR(50),
Status INT
)
INSERT INTO #BeforeLogUsed
EXEC('DBCC SQLPERF(logspace)')
/*Run Query*/
EXECUTE sp_executesql @SQL
/*Snapshot of logsize after query*/
CREATE TABLE #AfterLLogUsed(
[Db] NVARCHAR(100),
LogSize NVARCHAR(30),
Used NVARCHAR(50),
Status INT
)
INSERT INTO #AfterLLogUsed
EXEC('DBCC SQLPERF(logspace)')
/*Return before and after log size*/
SELECT
CAST(#AfterLLogUsed.Used AS DECIMAL(12,4)) - CAST(#BeforeLogUsed.Used AS DECIMAL(12,4)) AS LogSpaceUsersByInsert
FROM
#BeforeLogUsed
LEFT JOIN #AfterLLogUsed ON #AfterLLogUsed.Db = #BeforeLogUsed.Db
WHERE
#BeforeLogUsed.Db = DB_NAME()
/*Get list of affected indexes from insert query*/
SELECT
@Schema + '.' + so.name + '.' + si.name AS IndexName
INTO
#IndexNames
FROM
sys.indexes si
JOIN sys.objects so ON si.[object_id] = so.[object_id]
WHERE
si.name IS NOT NULL
AND so.name = @Table
/*Insert Record For Heap*/
INSERT INTO #IndexNames VALUES(@Schema + '.' + @Table)
/*Get log recrod sizes for heap and/or any indexes*/
SELECT
AllocUnitName,
[operation],
AVG([log record length]) AvgLogLength,
SUM([log record length]) TotalLogLength,
COUNT(*) Count
INTO #LogBreakdown
FROM
fn_dblog(null, null) fn
INNER JOIN #IndexNames ON #IndexNames.IndexName = allocunitname
GROUP BY
[Operation], AllocUnitName
ORDER BY AllocUnitName, operation
SELECT * FROM #LogBreakdown
SELECT AllocUnitName, SUM(TotalLogLength) TotalLogRecordLength
FROM #LogBreakdown
GROUP BY AllocUnitName
Insertion dans un tas sans index et TABLOCK à l'aide du code suivant ...
EXEC sp_GetLogUseStats
@Sql = '
INSERT INTO PostsDestination
SELECT * FROM Posts ORDER BY Id ',
@Schema = 'dbo',
@Table = 'PostsDestination',
@ClearData = 1
J'obtiens ces résultats
À une croissance de fichier journal de 0,0024 Mo, de très petites tailles d'enregistrement de journal et très peu d'entre eux, je suis heureux que cela utilise une journalisation minimale.
Si je crée ensuite un index non clusterisé sur id ...
CREATE INDEX ndx_PostsDestination_Id ON PostsDestination(Id)
Ensuite, exécutez à nouveau mon même insert ...
Non seulement je ne reçois pas de journalisation minimale sur l'index non cluster, mais je l'ai également perdu sur le tas. Après avoir fait plus de tests, il semble que si je fais un ID en cluster, il se connecte de manière minimale, mais d'après ce que j'ai lu 2016+, il devrait se connecter de manière minimale à un tas avec un index non cluster lorsque le tablock est utilisé.
MODIFICATION FINALE :
J'ai signalé le comportement à Microsoft le SQL Server UserVoice et mettrai à jour si j'obtiens une réponse. J'ai également écrit tous les détails des scénarios de journal minimaux sur lesquels je n'ai pas pu travailler https://gavindraper.com/2018/05/29/SQL-Server-Minimal-Logging-Inserts /
Je peux reproduire vos résultats sur SQL Server 2017 en utilisant la base de données Stack Overflow 2010, mais pas (toutes) vos conclusions.
Journalisation minimale à le tas n'est pas disponible lors de l'utilisation de INSERT...SELECT
avec TABLOCK
vers un segment de mémoire avec un index non cluster, qui est inattendu . Ma conjecture est INSERT...SELECT
ne peut pas prendre en charge les chargements en masse en utilisant RowsetBulk
(tas) en même temps que FastLoadContext
(b-tree). Seul Microsoft serait en mesure de confirmer s'il s'agit d'un bogue ou par conception.
L'index non cluster sur le tas est enregistré de façon minimale (en supposant que TF610 est activé , ou SQL Server 2016+ est utilisé, activant FastLoadContext
) avec les mises en garde suivantes:
Le 497 LOP_INSERT_ROWS
les entrées affichées pour l'index non cluster correspondent à la première page de l'index. Étant donné que l'index était vide auparavant, ces lignes sont entièrement enregistrées. Les lignes restantes sont toutes minimalement enregistrées. Si l'indicateur de trace documenté 692 est activé (2016+) pour désactiver FastLoadContext
, toutes les lignes d'index non cluster sont enregistrées de manière minimale.
J'ai trouvé qu'une journalisation minimale est appliquée à à la fois le tas et l'index non cluster lors du chargement en bloc de la même table (avec index) à l'aide de BULK INSERT
à partir d'un fichier:
BULK INSERT dbo.PostsDestination
FROM 'D:\SQL Server\Posts.bcp'
WITH (TABLOCK, DATAFILETYPE = 'native');
Je note cela pour être complet. Chargement en masse à l'aide de INSERT...SELECT
utilise différents chemins de code, donc le fait que les comportements diffèrent n'est pas totalement inattendu.
Pour tous les détails sur la journalisation minimale en utilisant RowsetBulk
et FastLoadContext
avec INSERT...SELECT
voir ma série en trois parties sur SQLPerformance.com:
Les commentaires sont fermés, je vais donc les aborder brièvement ici.
Ceci est enregistré de manière minimale en utilisant FastLoadContext
sans TABLOCK
. Les seules lignes entièrement enregistrées sont celles insérées dans la première page car l'index cluster était vide au début de la transaction.
Ceci est également enregistré de manière minimale à l'aide de FastLoadContext
. Les lignes ajoutées à la page existante sont entièrement enregistrées, les autres sont enregistrées de manière minimale.
Cela peut également être journalisé de manière minimale en utilisant FastLoadContext
tant que l'index non cluster est maintenu par un opérateur distinct, DMLRequestSort
est défini sur true, et les autres conditions énoncées dans mes messages sont remplies.
Le document ci-dessous est ancien mais reste une excellente lecture.
Dans SQL 2016, l'indicateur de trace 610 et ALLOW_PAGE_LOCKS sont activés par défaut, mais quelqu'un peut les avoir désactivés.
Guide de performances de chargement de données
(3) Selon le plan choisi par l'optimiseur, l'index non cluster de la table peut être entièrement ou minimalement journalisé.
L'instruction SELECT peut être le problème car vous avez un TOP et un ORDER BY. Vous insérez des données dans la table dans un ordre différent de celui de l'index, donc SQL peut faire beaucoup de tri en arrière-plan.
MISE À JOUR 2
Vous obtenez peut-être une journalisation minimale. Avec TraceFlag 610 ON, le journal se comporte différemment, SQL réservera suffisamment d'espace dans le journal pour effectuer une restauration en cas de problème, mais n'utilisera pas réellement le journal.
Cela compte probablement l'espace réservé (inutilisé)
EXEC('DBCC SQLPERF(logspace)')
Ce code se divise Réservé de Utilisé
SELECT
database_transaction_log_bytes_used
,database_transaction_log_bytes_reserved
,*
FROM sys.dm_tran_database_transactions
WHERE database_id = DB_ID()
Je suppose que la journalisation minimale (en ce qui concerne Microsoft) consiste en réalité à effectuer le moins de IO sur le journal, et non la quantité de journal réservée).
Jetez un oeil à ce lien .
MISE À JOUR 1
Essayez d'utiliser TABLOCKX au lieu de TABLOCK. Avec Tablock, vous avez toujours un verrou partagé, donc SQL peut se connecter au cas où un autre processus démarre.
TABLOCK peut devoir être utilisé conjointement avec HOLDLOCK. Cela applique le Tablock jusqu'à la fin de votre transaction.
Mettez également un verrou sur la table source [Posts], la journalisation peut avoir lieu car la table source peut changer pendant que votre transaction est en cours. Paul White a réalisé une journalisation minimale lorsque la source n'était pas une table SQL.