J'observe les documents Twitter depuis un certain temps maintenant, et je me suis heurté à un mur pour savoir comment obtenir des statistiques sur la croissance des abonnés sur une période de temps/le nombre de tweets sur une période de temps ...
Je veux comprendre de la communauté ce que fait since_id
et max_id
et count
signifient dans l'API Twitter.
J'ai suivi cette page https://developer.Twitter.com/en/docs/tweets/timelines/api-reference/get-statuses-user_timeline
J'essaie d'obtenir des statistiques pour un utilisateur -
Je voudrais de l'aide pour former des chaînes de querystes pour ce qui précède ..
Merci..
depuis_id et max_id sont deux paramètres très simples que vous pouvez utiliser pour limiter ce que vous obtenez en retour de l'API. De les docs :
since_id
- Renvoie les résultats avec un ID supérieur à (c'est-à-dire plus récent que) l'ID spécifié. Il y a des limites au nombre de Tweets accessibles via l'API. Si la limite de Tweets s'est produite depuis le Since_id, le Since_id sera forcé à l'ID le plus ancien disponible.max_id
- Renvoie les résultats avec un ID inférieur à (c'est-à-dire plus ancien que) ou égal à l'ID spécifié.
Donc, si vous avez un ID de Tweet donné, vous pouvez rechercher des tweets plus anciens ou plus récents en utilisant ces deux paramètres.
count
est encore plus simple - il spécifie un nombre maximum de tweets que vous souhaitez récupérer, jusqu'à 200.
Malheureusement, l'API ne vous rendra pas exactement ce que vous voulez - vous ne pouvez pas spécifier de date/heure lors de la requête user_timeline
- bien que vous puissiez en spécifier un lors de l'utilisation de l'API de recherche. Quoi qu'il en soit, si vous devez utiliser user_timeline, vous devrez interroger l'API, rassembler les tweets, déterminer s'ils correspondent aux paramètres que vous souhaitez, puis calculer vos statistiques en conséquence.
Le max_id = liste des id des tweets. depuis_id = bas de la liste des ID de tweets.
pour en savoir plus: regardez en profondeur dans le dernier diagramme .. ici
Les paramètres max_id et since_id sont utilisés pour empêcher la redondance dans le cas d'appels à l'API Twitter. Visualisez les tweets qui entrent sur une pile. Un appel API doit spécifier le nombre (nombre) de tweets qui seront traités. Mais au fur et à mesure de cet appel, de nouveaux tweets peuvent être ajoutés. Dans ce cas, si vous dessinez une pile et exécutez le processus, vous remarquez qu'il peut y avoir une `` fragmentation '' ou des sections de tweets non traités coincés entre ceux qui sont traités. Ceci est également visible dans l'image ci-dessous.
Pour contourner ce problème, deux paramètres sont utilisés pour garder une trace du Tweet ID le plus récent/le plus performant précédemment traité (since_id) et le Tweet ID le plus ancien/le plus récent récemment traité (max_id). Le depuis_id pointe vers le bas du 'fragment' et le (max_id-1) pointe vers le haut du 'fragment'. (Notez que le max_id est inclusif contrairement au Since_id) Ainsi, les paramètres ensemble gardent une trace de la partie de la pile Tweet qui doit encore être traitée.