J'ai passé en revue un exemple du cours d'Andrew Ng en apprentissage automatique que j'ai trouvé dans https://github.com/jcgillespie/Coursera-Machine-Learning/tree/master/ex . L'exemple traite de la régression logistique et de la classification un contre tous. J'ai un doute sur cette fonction:
function [all_theta] = oneVsAll(X, y, num_labels, lambda)
%ONEVSALL trains multiple logistic regression classifiers and returns all
%the classifiers in a matrix all_theta, where the i-th row of all_theta
%corresponds to the classifier for label i
% [all_theta] = ONEVSALL(X, y, num_labels, lambda) trains num_labels
% logisitc regression classifiers and returns each of these classifiers
% in a matrix all_theta, where the i-th row of all_theta corresponds
% to the classifier for label i
% Some useful variables
m = size(X, 1);
n = size(X, 2);
% You need to return the following variables correctly
all_theta = zeros(num_labels, n + 1);
% Add ones to the X data matrix
X = [ones(m, 1) X];
% ====================== YOUR CODE HERE ======================
% Instructions: You should complete the following code to train num_labels
% logistic regression classifiers with regularization
% parameter lambda.
%
% Hint: theta(:) will return a column vector.
%
% Hint: You can use y == c to obtain a vector of 1's and 0's that tell use
% whether the ground truth is true/false for this class.
%
% Note: For this assignment, we recommend using fmincg to optimize the cost
% function. It is okay to use a for-loop (for c = 1:num_labels) to
% loop over the different classes.
%
% fmincg works similarly to fminunc, but is more efficient when we
% are dealing with large number of parameters.
%
% Example Code for fmincg:
%
% % Set Initial theta
% initial_theta = zeros(n + 1, 1);
%
% % Set options for fminunc
% options = optimset('GradObj', 'on', 'MaxIter', 50);
%
% % Run fmincg to obtain the optimal theta
% % This function will return theta and the cost
% [theta] = ...
% fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), ...
% initial_theta, options);
%
initial_theta = zeros(n + 1, 1);
options = optimset('GradObj', 'on', 'MaxIter', 50);
for i = 1:num_labels
c = i * ones(size(y));
fprintf('valores')
[theta] = fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), initial_theta, options);
all_theta(i,:) = theta;
end
% =========================================================================
end
Je sais que la fonction lrCostFunction prend comme paramètres: thêta, X, y et lambda, mais je ne peux pas comprendre d'où vient la valeur de t dans le code que j'ai affiché ci-dessus; spécifiquement dans cette partie:
[theta] = fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), initial_theta, options);
de l'aide?
fmincg
prend le handle de la fonction objectif comme premier argument, qui dans ce cas est un handle vers lrCostFunction
.
Si vous allez à l'intérieur fmincg.m
, vous trouverez les lignes suivantes:
argstr = ['feval(f, X']; % compose string used to call function
%---Code will not enter the following loop---%
for i = 1:(nargin - 3) %this will go from 1 to 0, thus the loop is skipped
argstr = [argstr, ',P', int2str(i)];
end
% following will be executed
argstr = [argstr, ')'];
À la fin de l'extrait de code ci-dessus, le résultat sera,
argstr=feval(f,X');
Si vous avancez un peu, vous verrez,
[f1 df1] = eval(argstr); % get function value and gradient
Par conséquent, le descripteur de fonction f
s'exécutera avec un argument X'
. Donc, t=X'
, ce qui est également logique. Le theta
initial convergera pour vous donner le vecteur de paramètre final pour la régression logistique.
Vous pouvez réellement remplacer.
for i=1 : num_labels
[theta]= fmincg (@(t)(lrCostFunction(t, X, (y == i), lambda)),initial_theta, options);
all_theta(i,:)=theta;
essaye ça
for i = 1:num_labels,
[all_theta(i,:)] = fmincg (@(t)(lrCostFunction(t, X, (y == i), lambda)), initial_theta, options);
end;
vous n'avez pas non plus besoin d'initialiser all_theta au début